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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是: 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外,曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 



往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前)的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助,在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学” (Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生，一直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究’’丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以飨 
中文读者时,我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜; 中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 

工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



回顾过去 20 多年的社会科学研究，我们提出了一个始终 
如一的 发现: 婚姻会增加幸福感。 Stack 与 Eshle _ S —篇讨 
论这一问题的文献中总结道 :“已 婚者相对于未婚者在幸福感 
方面的一个明确的指标——总体幸福感上的优势似乎是真实 
的。 ”(1998:527) 通过研究17个国家的数据，他们得出“对男性 
与女性，婚姻等同地增加幸福感”的结论(1998:527)。存在争 
论的是两个问题——婚姻是否能增加幸福感和两性之间的增 
加是否相同(或者如某些研究者认为的，男性比女性增加得 
多)。 另外一个我们关心的问题是，无论两性不同还是相同， 
这一增加的幸福感是否在婚姻的历程中有所变化。通过分析 
一个全国范围的17年、5期的样本， VanLangingham、Johnson 
和 Amato (2001) 发现，没有证据支持文献所建议的生命过程中 
婚姻幸福感的 U 形模式(幸福感的减少及在晚年的回升)。 

对于上面提到的研究问题，有两种方法论的途径 :使用 
横截面数据或者纵向数据比较结婚的人和没有结婚的人。 
很多关于这个问题的研究使用了横向数据。然而，要对“婚 
姻增加幸福感”这个简单的论述作出合适的评价，使用纵向 
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数据是必要的。一些研究者，比如 VanLaninghamGOOl ) 等 
人，确实使用了纵向数据(他们使用了固定效果模型）。我们 
真正想研究的是以下 情形: 在时点0上，有一个随机未婚人 
群的样本，这些人被 追踪; 在时点1的时候，有些人结 了婚; 
在时点2的时候，又有一些人结了婚。但是有一些人在整个 
追踪的时期内都没有结婚，即使当他们完成自己生命历程的 
时候，也还是有人没有结婚。横向数据只是截取一个时点，然 
后比较那些结过婚的人和没有结过婚的人，而忽略了人与人 
之间的不可观测的差异性。纵向分析模型(例如，固定效果模 
型、随机影响模型和混合影响模型)恰当地处理了不可观测的 
差异性问题。更合适的方法是潜变量增长曲线模型，这种方 
法不仅能够处理不可观测的差异性问题，也能够对男性和女 
性分别就他们生命历程中婚后的幸福感进行潜在趋势研究。 

Preacher 、 Wichman、MacCallum 和 Briggs 的潜变量增 
长曲线模型为社会科学量化应用的研究者提供了一个学习 
一种新方法的研究，像上面提到的实体问题的独一无二的机 
会，并可以超越经验性的研究。他们显示了潜变量增长曲线 
模型作为结构方程模型是如何表达和估计的，并说明了它和 
多层次增长模型的关系。在本书中，作者显示了各种各样的 
模型，例如固定/随机截距和/或者固定/随机坡度、有条件增 
长曲线模型、平行过程模型、多组分析。他们也讨论了模型 
的各种延伸，例如分段增长、结构潜在增长、类型和有序变量 
结果等。他们用了大量说明性的图形来表述和讨论，这是使 
用结构方程模型的一个优势。 


廖福挺 
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潜变量壜长曲线植型 


社会和行为科学的一个根本观察就是人随时间而变化， 
但并不是以同样的方式或同样的速度。譬如,词汇能力在小 
学阶段会稳步地提高，但并不是所有的学生都会以同样的速 
度提高。在很多情况下，变化的速度和方向都存在个体差 
异，而这些变化中的个体差异往往具有科学上或实践上的意 
义。时间上的变化可以用秒(如在心脏反应研究中）或用十 
几年来测量(如在生命发展研究中）。例如，夫妻争执会在短 
短的几分钟内引起显著的内分泌变化，但这些变化对于丈夫 
和妻 子而言 ，可能会十分不同 （ Kiecolt-Glaser et al . ， 1997)。 
通过分析青少年跟踪调查数据， Flora 和 Cha SS in (2005) 检验 
了父母酗酒对青少年使用毒品增长的影响。早期研究变化 
的方法有很大的局限: （1) 它们只关注群体层面或个体层面的 
增长; (2) 它们只着眼于两个时间点上的测量，导致数据过于 
贫乏而不能检验一些最基本的关于变化的有意思的假设。科 
学家常常需要更广泛的数据和更高级的统计方法来区分和理 
解变化的形态和方向(轨迹)，并确定变化的原因和后果。 

纵向设计能够得到关于心理现象的趋势和个体变化差 
异的有价值信息。这类数据的丰富性随着数据收集次数的 
增加而增加。 Willett (1989) 以及 Willett 与 Say er (1994) 讨论 
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了相对于二期数据，多期纵向数据的几个优势：（1)研究结果 
的质量会得到 提高； （2) 根据心理学理论可以建立正确的增 
长 函数; ⑶可以检验系统中个体间成长差异的 假设; ⑷可 
以将成长的特性与背景特点联系起来 K 5) 成长测度的精确 
性与准确性随着数据期数的增加而快速提高。简言之，纵向 
数据不仅提高了假设检验的统计效力，而且使研究者可以检 
验他们用横截面或二期数据无法检验的假设。 

虽然利用纵向数据的这些优势使许多方法发展起来，但 
本书所关注的是潜变量增长曲线模型 ( LGM )。 潜变量增长 
曲线模型代表了一类广泛的统计方法，这些方法允许更好的 
假设表述，提供更好的统计效力，并且比起别的方法，这些方 
法使统计模型与理论更好地衔接在一起。潜变量增长曲线 
模型不仅可以直接检测个人在不同时点的变化，而且能够检 
查不同个体之间的差异。这个模型的好处不仅在于它能够 
建构变化模型，还在于它允许研究者探寻变化的前因后果。 

潜变量增长曲线模型框架可以让科学家清楚地表达和 
检验如下的问题: （1) 随着时间的推移,均值变化趋势的形态 
是什么样的？ （2) 最初的水平是否可以预测变化速度? 
(3) 两组或多组分组是否在变化轨迹上有区别？ （4) 是否可 
以通过均值变化趋势的速度或弯曲度预测重要的结果? 
(5) 哪些变量与随着时间的推移而产生的变化有系统的关 
联？ （6) 根据观测数据，关于变化轨迹的理论假设是否站得 
住脚？ （7) 变化轨迹的形态是否存在显著的个体间差异? 
(8) —个变量的变化是否与另一个变量的变化相关？ 

上述问题当然不是详尽无遗的。接下来，我们将对本书 
的其余部分进行概述。 
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潜变量增长曲线横型 


第1节 I 本书概述 


本书是为那些对研究随时间推移的变化现象感兴趣的 
读者而著。不过，因为潜变量增长曲线模型是结构方程模型 
的一个应用，所以我们建议读者应具备基本的结构方程模型 
的知识。对于那些对潜变量增长曲线模型感兴趣的研究者 
而言,对多元线性回归、运用路径图来表示模型、模型识别问 
题以及固定参数和自由参数等话题有一定程度的熟悉是必 
要的。 有用的 人门书籍包括 Kline(2004) 、 Maruyama(1997) 
和 Raykov 以及 Marcoulides(2000) 的著作。更高级的内容可 
以在 Bollen(1989) 的书中找到。 

为了演示潜变量增长曲线模型的功用和灵活性，我们首 
先从一个非常基本的模型开始，然后以此模型为基础进行常 
用的拓展。这些拓展允许在变化过程中加人更深人的理解 
和更清楚有力的假设检验。在每一个步骤中，我们都将模型 
应用于一个现成的数据集，来演示研究者如何在应用中着手 
处理问题。我们会示范如何使用 LISREL (Joreskon &- 
Sorbom, 1996)、 Mx(Neale, Boker, Xie &- Maes, 2003) 和 
Mplus(L. K. MutKen Muthen, 1998 一 2006) 这三种流行的 
结构方程模型应用软件来拟合模型与数据，当然也可以使用 
其他方便使用的结构方程模型软件(譬如 EQS 和 AMOS )。 
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由 LISREL 和 Mx 所获得的结果都是相同的(或几乎完全相 
同）。程序命令都列在我们的网站上 [1] ，但我们所描述的绝 
大部分模型都可以通过几乎任何一个结构方程模型软件来 
实现。此外，我们还提供了一个详尽的参考文献列表，以方 
便有兴趣的读者获得更多的信息。所以，本书不仅使研究者 
能够了解潜变量增长曲线模型，而且可以帮助研究者深人探 
讨有关文献。 

我们首先扼要地概述促使潜变量增长曲线模型发展的 
研究，然后描述正式的模型设定，随后是关于参数估计和模 
型评估的章节。在这些介绍性的材料之后，我们将介绍本书 
所使用的数据集和用于分析的软件。本书的其余部分描述 
了在实践中可能会遇到或用到的具体模型。从一个基本的 
(零)模型开始，我们通过一步步地放宽对参数的限制并添加 
另外的变量来探究更复杂的增长曲线模型。然后，我们探讨 
一些有趣的和常见的基本潜变量增长曲线模型的拓展，包括 
相关的增长曲线(多增长过程同时建模)、队列序列设计、添 
加随时间变化的协变量和更复杂的增长函数。在这些例子 
之后，我们将讨论潜变量增长曲线模型和其他技术的关系， 
包括增长混合模型、分段增长曲线、潜变量变化模型以及多 
层模型与潜变量增长曲线模型的区别。 
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潜变量增长曲线模型 


第2节 | 潜变量増长曲线 横型: 简短的 
历史与概述 


在历史上,增长曲线模型（例如 Potthoff Roy , 1964) 
一直被用来为纵向数据建模。在纵向数据中，一些结果变量 
在不同时点被重复测量。潜变量增长曲线模型方法来源于 
探索性因子分析及相关文献。重复测量中的协变量可以用 
探索性因子分析 （ Baker , 1954； Rao , 1958) 或主成分分析 
( Tucker , 1958， 1966) 来建模。之后，因子或成分再被概念 
化为变化的方面或计时测量(与心理测量相对）因子 ( McAr - 
dle , 1989 ； McArdle &- Epstein , 1987) ，因子负载可以被解释 
为重复测量对这些不可观测的变化方面依赖性的参数。这 
些变化方面可以包括线性、二次式或 S 形趋势。不过，用这 
些方法来研究变化时有许多问题。在实践中运用这些方法 
的一个主要障碍是因子旋转的不确定性——没有一个明确 
的因子旋转标准能选择一个负载模式来拟合可解释的变化 
方面(例如 ，一 组多项式曲线）。虽然人们一直尝试发展可以 
用来识别平滑型函数的因子旋转标准（如 Arbuckle & 
Friendly , 1977； Tucker , 1966) ，但没有一个能完全令人满 
意。这些方法的另一个局限在于，它们是从估计未知函数趋 
势的自由负载的观点来为变化建模的(一种探索性方法），而 
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不是检验一组特定的负载的可行性(一种验证性方法）。对 
许多研究者而言，能够检验特定的假设趋势是非常重要的。 

Meredith 和 Tisak (1990) 描述了潜变量曲线分析-- 

个验证性因子分析的应用。这一分析通过允许研究者指定 
反映重复测量数据中特定的假设趋势负载，巧妙地回避了因 
子旋转不确定性的问题。这一潜变量曲线分析方法就相当 
于我们所说的潜变量增长曲线模型。因为潜变量增长曲线 
模型是验证性因子分析的一个应用，而后者又是结构方程模 
型的特例，所以增长曲线模型能够被放到更大的理论模型 
中。对潜变量增长曲线模型历史发展的细节感兴趣的读者， 
可以参考 Bdlen 与 Curnm (2006) 为之提供的一个详尽的 
综述。 

与其他竞争的方法(如协方差分析和多层模型)相比，潜 
变量增长曲线模型有几个优势。潜变量增长曲线模型允许 
对个体间在变化上的差异进行研究，并允许研究者研究变化 
的前因后果。潜变量增长曲线模型能够提供组级水平的统 
计指标，例如平均增长速度和平均截距，也能够对具体的曲 
线进行假设检验，并可以同时纳人随时间变化的变量和不随 
时间变化的变量。比起结构方程模型，潜变量增长曲线模型 
也有其优点，包括能够检验模型拟合指数、提供模型选择的 
标准、通过使用重复测量的潜变量解决测量误差问题，并能 
有效地处理缺失数据。不同总体和组别之间的比较也很简 
单明了。所以，潜变量增长曲线模型是一个非常灵活的模型 
策略，对于一些不太常见的情况也能够处理。 

Curran 和 Willoughby (2003) 在讨论增长曲线模型的时 
候阐述了一个观点，认为增长曲线模型“可以被看成以变量 
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为中心和以研究对象为中心的一个交叉点”(2003:603)。仅 
以变量为中心的变化视角强调平均趋势的变化，而仅以研究 
对象为中心的变化视角只聚焦于个人特征的变化趋势。当 
然每个视角都能够让我们获取重要的信息。与仅考虑变量 
或者研究对象为中心相比，潜变量增长曲线模型不仅能够获 
取平均的变化趋势，而且能够看出个人相较于平均的偏离。 
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第3节 | 模型设定和参数解释 


潜变量增长曲线模型可以被看成结构方程模型的一个 
特例。结构方程模型是一个总的模型框架，它能够设定和检 
验不同变量之间的关系，其中有一部分变量是能观测到的， 
另一部分是潜变量。潜变量经常代表一些心理学概念，我们 
通常不能直接测量这些概念。一个典型的结构方程模型包 
含一小组潜变量,这些变量通常通过通径系数连接在一起， 
并被解释为回归权数。潜变量依次由可测量的标识变量来 
表示。潜变量和标识变量之间的关系就像因子分析模型。 
也就是说，因子负载代表了潜变量对标识变量的影响。 

一般结构方程模型的特例可以生成基本的潜变量增长 
曲线模型。在这里，我们先展示这一特例，在后面，我们会应 
用更多一般化的结构方程模型来发展更复杂的潜变量增长 
曲线模型。在潜变量增长曲线模型中，变量 y 是被重复测量 
的可测量变量，而潜变量的实质不是心理学的概念，相反，潜 
变量代表的是一种 y 的变化模式或方面。在一个基本的潜 
变量增长曲线模型中，为了表示变化的方面，两个因子通常 
需要设定。这些因子通过设定重复测量变量^的因子负载 
来定义，而这些因子负载描述了^的变化趋势。截距因子描 
述当时间变量等于0时，结果变量^的水平，而斜率因子则 





潜变量增长曲线模型 


描述结果变量变化的速度。举例来说，一个对儿童外化的线 
性变化速度感兴趣的研究者可以收集外化行为的重复测量， 
然后把这些重复测量当做截距因子与斜率因子的标识(限制 
因子负载来反映对外化行为 ® 变量变化模式的预期）。我们 
将会展示潜变量增长曲线模型框架的灵活性同样允许设定 
更为复杂的模型。 

一个潜变量增长曲线模型可以依据数据模型、协方差 
结构和均值结构用矩阵表示法来表述数据模型描述因子 
(潜在变量)与^的重复测量之间的关系。 [2] 这个模型把 PX 
1 观测值向量 (y) 表述为截距 (T, ， pxi )、 m 个代表变化方面 
( n , w XI ) 的潜变量以及扰动项 (b p XI ) 的一个线性函数， 
将因子负载 ( A ,， fXm ) 作为回归系数 

y = + A , ri+e [1.1] 

T , 项通常会因为模型识别的原因而被设定为0。在展开式中 
( m = 2 ), 这一模型把％ ,即个体〗在时点 i 的值，表述为两 
个潜变量 (7*, 与和)和一个扰动项(^ ) 的 函数： 

= ~\~ XztTjzi £»■ [ 1 . 2 ] 

潜变量则可以表述为潜均值 ( ai 与 a 2 ) 和个体与这些均值偏 
差的 函数： 

J /1, =0：】+ 〔，② [1_3] 

Tjzi = ffz + ?2, [1. 4] 


① 外化行为是心理学上的概念，一般指失控行为，如攻击、过失等行为问 
题。——译者注 

② 此处原文公式为和 =«.+?„. 应该是一处笔误。——译者注 
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潜变量 7*. 与和常常被称为“随机系数”。表示个体与 加和取 
的均值偏差的残差〔往往被称为“随机 效应' 

从方程 1. 1的数据模型中，我们可以导出一个协方差结 
构和一个均值结构。协方差结构将; y 的重复测量的总体方 
差和协方差表示成模型参数的一个函数，而均值结构则将这 
些重复测量的总体均值表述为模型参数的另一个函数。均 
值结构和协方差结构与数据模型的区别在于，它们不包含个 
体观测对因子(如截距因子和斜率因子）的作用。这些模型 
常常被用来进行参数估计和模型评价。在协方差结构中，观 
测变量的方差和协方差矩阵 (S, fX/O 被表示为因子负载矩 
阵 (A y ) 、因子方差和协方差矩阵(V， mXm) 以及扰动项的方 
差和协方差矩阵(玖，的函数 ( Bdlen，1989): 

X= A,¥A；+0 t [1. 5] 

通过对数据模型求期望值而得到的均值结果，将观测变量 
(K ， P X 1) 的总体均值表示为截距 (T,, PX1) 和潜变量均 
值 （ct，mX 1) 的函数： 


= T, + Ayit [1. 6] 

在潜变量增长曲线模型中， T, 的元素经常(但不是总是)被 
限制为0,从而获得一个简化的数据模型和均值结构。因 
此，所考虑的参数就包含在矩阵 A y 、W 和 0 E 以及向量 et 中。 
A, 的列被称为“基础曲线”或“潜变量增长向量” (Singer & 
Willett, 2003)。 

在图 1. 1的模型中, Y1 到 Y5 表示变量 Y 的平均间隔的 
重复测量。在这里, Y 的变化被建模为两个基础曲线的函 
数，因此，负载矩 阵乂有 两列。截距因子的负载被固定为1, 
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以表示一个常数对重复测量的影响，斜率因子的负载被固定 
为一个线性的级数，以表示随时间变化的线性增长。虽然斜 
率负载一般被设定为从0开始，以使第一时点的测量表示初 
始反应，但这不是必须的，而且实际上往往是不恰当的。也 
可能存在额外的因子负载，其中每一个都表示增长的其他方 
面。这些负载常常(虽然并不一定)是多项式(参见第2章的 
模型10)。此外,这些变化方面的协方差可以通过设定负载 
间的协方差路径来估计。估计这些协方差的能力在一些情 
况下是非常重要的，譬如当我们对确定一些变量的增长速度 
是否与其初始状态相关感兴趣时。图 1. 1中的三角形表示 
常数1。因此，连接三角形与基本负载的路径系数就基于一 
个常数的回归，表示截距和斜率因子的均值。 



注 :根据 结构方程模型的惯例，圆形表示潜变量，矩形表示测定变量(在这 
里， Y1 到 Y5 是平均间隔的重复测量)，三角形表示常数，双箭头表示方差或 
协方差，单箭头表示回归权数,数值对应固定参数，符号则表示自由参数(有 
待估计的参数)。 

图 1.1 一个 典型的 潜变量 增长曲线模型的完整路径图 
(包括随机截距、随机线性斜率和截距一斜率协方差参数> 
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在用矩阵表示 Y 1 至 Y 5 的协方差结构时，设定截距和斜 
率因子在重复测量上的负载等同于完全设定皂，即因子负载 
矩阵的内容。对于一个具有同方差性和独立扰动协方差的 
简单线性增长模型，其中重要参数的必要限定 包括： 
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[1. 7] 


[ 1 . 8 ] 


[1. 9] 


[ 1 . 10 ] 


解释这些矩阵中的参数是直截了当的。研究者固定皂 
中的元素来表示所假设的变化轨迹，它的每一列负载表示假 
设的一个变化方面。在方程 1. 7中，所有第一列的元素都被 
设定为1，以反映每个个体的截距在重复测量上保持不变这 
一事实。 A y 中第二列的线性级数表示相等时间间隔的线性 
增长假设。¥的元素表示这些变化方面的方差和协方差。 
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就图 1.1 中的简单线性增长来说，矩阵包括截距方差 
(如）、斜率方差(如）以及截距与斜率的协方差(如 ） 。 a 的元 
素是从常数 1 . 0来预测变化方面的回归系数，它们可以被解 
释为平均截距和平均斜率。特别是方程 1. 9中的 a 2 表示一 
个单位的时间变化所导致的结果变量的预期变化。最后，铁 
中的元素是扰动项的方差和协方差，表示数据中假设的潜变 
量曲线无法解释的方差部分。 [4] 如果我们假定扰动项方差服 
从同方差性(如方程 1 . 10所假定的），单一的扰动项方差可 
以通过给 0 t 的对角线元素加上一个相等的限定条件来表 
示。 ® E 中的非对角线元素常常被设定为0来表示不同时点 
的扰动项是不相关的，虽然这一假定并不是必要的。这个基 
本的潜变量增长曲线模型可以被拓展，比如加入截距和/或 
斜率的预测变量，多个结果变量的并行增长曲线以及参数限 
制(譬如，截距和斜率的协方差可以被限定为 0) 等。相关拓 
展将在后面讨论。 

概括来讲，不管重复测量的数目有多少，在一个典型的 
潜变量增长曲线模型的线性应用中，我们需要估计六个参 
数。这些参数包括平均截距和斜率 ( ai 和&)、截距和斜率的 
方差与协方差(如、如和如）以及一直保持不变的扰动项方 
銳 h 其余的参数通常被限定为0或与一个特定的变化模 
式相一致的数值。正如读者将会看到的，依赖于特定的应用 
所需，这些限定中的一部分可以通过各种方式被改变或放 
宽。在更为复杂的模型中，如预测非线性增长或变化的模 
型，其他自由参数还会被添加进来。 
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第4节 | 时间的测量尺度 


在图 1. 1和方程 1. 7中，时间在某种程度上被重新编码 
以表示线性的变化，即将时间测量尺度的起点放在测量的第 
一时点 ( A ll2 = 0)。方程 1. 7中展示的负载模式，即截距被解 
释为“初始状态”，是典型的时间编码方式。但从特定的研究 
问题出发，其他编码方式同样是有用的。如果在某种情况 
下，最后时点的测量(例如，完成一个毒品康复计划)是研究 
最为关心的时点，把最后测量的时点编码为0就更为合理， 
如下面的负载矩阵 所示： 

「1 -4] 

1 —3 

A ,= 1 -2 [1.11] 

1 一 1 
1 0 _ 

在方程 1.11 中，斜率的负载呈线性增长，但截距被定义为 
第五时点，即最后一个时点的均值。此外，如果用月而不是 
用年来编码时间则更为合理，方程 1. 11可以被重新参数 
化为： 
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「1 (h 
1 12 
1 24 
1 36 

1 48 


[ 1 . 12 ] 


这一变化导致对方程 1. 11和方程 1. 12的负载矩阵中，与斜 
率因子相关的某些模型参数(如平均斜率或可观测标识变量 
对于斜率的回归权数)的解释有所不同，但整个模型的拟合 
程度不会改变。事实上，任何对负载矩阵的线性转化都不会 
改变模型拟合程度，虽然这些转化的确会对参数的解释产生 
重要的影响 ( Biesanz ， Deeb - Sossa , Papadakis , Bollen &- Cur ¬ 
ran , 2004； Hancock Lawrence , 2006； Mehta West , 
2000； Rogosa &- Willett 1985； Stoel , 2003； Stoel van den 
Wittenboer , 2003； Stoolmiller , 1995; Willett , Singer 
Martin , 1998)。 譬如，将时间变量对均值对中在很少的情况 
下是合理的，因为中央时点的情况常常不是我们所关心 
的。 [5] 更合适的做法是将时间变量编码为在某种程度上有助 
于回答实质问题的形式。时间测量尺度的零点应该被设在 
一个有意义的测量时点上，部分是因为这一选择决定了解释 
平均截距、截距方差和截距一斜率协方差的时点 （Rogosa & 
Willett , 1985) 。 Stoel (2003) 以及 Stoel 与 van den Wittenboer 
(2003) 认为，截距只在存在自然原点的增长过程下才有意 
义。如果时间原点是任意选定的，那么应该避免对任何与截 
距相关的参数进行解释。同样，对于时间度量的选择应当便 
于增强可解释性 （Biesanz et al . ，2004)。在某些情况下，这 
可能会涉及在同一个模型中同时使用两个时间度量标准(例 



第 1 章简介 


17 


如，年龄和测量期，参见 McArdel Anderson , 1990)。 

一^普遍的问题是关于所使用的重复测量的最优数目。这 
个选择在很大程度上是由实际的考虑，如时间与费用决定的。 
对 m 项多项式增长因子，无论不同时点的扰动项的方差是否被 
设定为相等，为了获得一个自由度至少为1的模型，最小的重复 
测量的数目应该是 m +1。 假如要估计的参数只包括因子均值、 
因子(协)方差和扰动项方差，这个公式就一直有效。一个自由 
度至少为1的模型(即一个过度识别的模型)是必需的，这是因 
为如果自由参数的个数等于或大于样本观测变量的均值和(协) 
方差的数目，模型就不能识别，也不能被检验(关于模型识别的 
更多细节，参见 Bollen , 1989； Bollen &• Curran , 2006) 0 

鉴于 m + 1是绝对的最小值，那么我们应当使用多少重复 
测量呢？ Stoolmill er (1995) 建议大概四个至五个测量时点就足 
以为线性增长建模。 MacCallum 、 Kim、Malarky 和 Kiecolt - 
Glaser ( 1997) 认为并没有可靠的经验法则，但建议线性模型至 
少需要四个至五个重复测量，而更为复杂的模型需要的测量 
可能会“比那多得多 ”（1997: 217)。为了获得足够的统计效 
力来检验并行过程潜变量增长曲线模型(第2章的模型 7) 中 
的斜率因子间的协方差， Hertzog 、 Lindenberger、Ghisletta 
和 von Oert Zen (2006) 推荐至少收集六个重复测量数据，但这 
个数目可以根据效应大小、样本数量或增长曲线的可靠性 
(总体方差被模型的增长方面所解释的比率）的变化而增加 
或减少。如同其他数据分析一样，更多就意味着更好，更多的 
数据产生更多的信息，这永远不会是一件坏事。不过，我们的 
经验是简约的线性模型在拟合超过六个重复测量时常常会有 
问题。这应该不是意外，因为很少有自然的变化过程会精确 
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地遵循线性的模式。没有任何模型是正确的,因此研究者应 
当对随着信息的累积，简单的模型会拟合较差这一结果做好 
心理准备。潜变量增长曲线模型最适合对大样本在有限个 
数的时点测量的趋势进行建模。无论测量的数目是多少，测 
量的范围应当足以跨越理论感兴趣的整个时间框架。 

最后需要注意的是，测量的时点并不一定要平均隔开。 
譬如，纵向数据是在1977年、1979年、1983年和1984年收集 
的，测量时点之间的间隔就变成2、4和1: 


A, = 


On 


[1.13] 


方程 1. 13中的负载矩阵仍然表示线性的变化，斜率负载之 
间的间隔本身就是测量时点之间间隔的线性尺度转换。如 
果将1977年作为基准线，随后的测量时点就发生在2年、6 
年和7年之后。在非线性模型(如第2章中描述的多项式潜 
变量曲线模型或第3章中讨论的结构潜变量曲线模型）中， 
收集五个以上的重复测量，并在变化发生最迅速的时期将测 
量设定得更加紧密常常是一个好主意。这有助于避免估计 
上的问题，并能对描述变化的参数进行更准确的估计。 

我们的观点是，并没有一个通用的设计和相应的增长曲 
线模型。测量期的数目、测量期之间的时间间隔、时间的单 
位以及时间原点的设定在相同或不同的研究中都可能相当 
不同。更为深人的关于时间测量尺度的探讨可以在 Biesanz 
等人(2004 )、 Curran 与 Willoughby (2003 ) 、 Hancock 与 Choi 
(2006)、 Schaie (1986) 和 Stoolmiller (1995) 的著作中找到。 
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第5节 | 异步测量 


A , 中的负载与用户所熟悉的结构方程模型的其他固定 
参数有根本性的不同。无论时间是如何编码的， A , 的内容 
都表示时间的函数。举例来说，斜率负载包含在其他模型中 
可以被认为是时间自变量的数值中。许多潜变量增长曲线 
模型的应用都过于简单地假定对所有的个体而言，数据是在 
同一个时点收集的 （Mehta &■ West , 2000)。这样的数据被 
称为“时间一结构数据” ( Bock , 1979)。所有被研究的对象在 
相同测量时点的数值可以被放人一个共同的 A , 矩阵，但是 
这在大多数应用中是不现实的。因为当个体并不是在同一 
时点被测量的，或该个体在同一时点但年龄不同的测量情况 
下，使用早先描述的基本潜变量增长曲线模型就不恰当了。 
如我们将要讨论的，当个体在不同时点被测量时，主要有两 
种策略来估计增长曲线模型。这两种策略都允许个体具有 
不同的负载因子。 

当并不是所有的个体都在同一时点被测量，但是有一套 
有限的测量时间表时，我们就可以运用多群体策略，即同时 
估计多个有不同的 A , 矩阵的模型。我们将在下一节更详细 
地讨论这一策略，但基本上它涉及将有共同测量时间表的个 
体分组，然后对所有的组同时进行模型拟合 ( Allison ， 1987； 
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T . E . Duncan , Dunca , Strycker , Li &- Alpert , 1999； McAr - 
dle Bell , 2000; McArdle &■ Hamagami , 1991； B . Muthen , 
Kaplan b Hollis , 1987)。 因此,所有只在时点1、时点3、时 
点5和时点6被测量的个体就属于第一组，而所有只在时点 
1、时点3、时点4和时点5被测量的个体就属于第二组。 

在有太多不同的测量时间表的情况下，多群体的办法就 
不能解决问题了，但有一个更普遍的解决办法。 Mx 和 
Mplus 程序的一个引人注目的优点就是它们可以通过运用 
定义变量或个体数据矢量——包含每个个体固定值的特殊 
矢量——来包含所有个体的斜率负载 （ Hamagami ， 1997； 
Neale et al . , 2003)。 传统的方法是将一个模型应用到被假 
定有同样的基本曲线和同样的 A y 的所有个体上，定义变量 
的运用则是给每个个体都建立一套独特的斜率因子负载。 
在涉及年龄的纵向研究的特殊情况中，这被称为“对个体调 
整年龄 ” (Mehta &• West , 2000 )。 Mehta 与 West (2000) 的著 
作中的附录 A 和我们的网站 ( http :// www . quantpsy . org ) 上 
都包括了展示这一方法的 Mx 程序样例。 
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第6节 | 前提假设 


使用最大似然估计的潜变量增长曲线模型需要一些重 
要的前提假设。大多数前提假设涉及潜变量的分布(例如潜 
变量增长曲线模型中的截距、斜率和扰动项等）。因为根据 
定义，这些变量是不可观测的，根据惯例就需要假定它们的 
特征。我们假定方程 1. 2、方程 1. 3和方程 1. 4中，扰动项与 
残差的均值为0。在每个时点，这一假设不仅针对总体均值， 
而且针对同一个体在理论情况下重复观测的均值。也就是 
说，如果能够在一个特定时点对同一个体重复测量，我们就 
假定这些量度的扰动项的均值为0。同样，所有残差项的同 
一时点或时点之间的协方差都被假定为0,方程 1. 2中，残差 
与随机截距和随机斜率的协方差也被设定为0。为了使用最 
大似然估计法，我们还需要假定可观测的变量是从一个与多 
元正态分布有大致相同的峰度的总体分布中得来的。潜变 
量增长曲线模型的前提假设在 Bollen 与 C urran (2006) 的著 
作中有大量的论述。 

Byrne 与 Crombie ( 2003) 讨论了另外三个前提假设。他 
们要求假设轨迹是线性的、不同时点的扰动项互不相关以及 
所有时点的扰动项的方差不变。实际上，这些并不是潜变量 
增长曲线模型或最大似然估计的前提假设。 Byrne 和 Crombie 
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的线性假设指的是增长轨迹的线性，而不是负载。这其实不 
是一个前提假设，而是要仔细检查的中心假设。两种可以检 
验线性假设的方法是比较线性增长曲线模型的拟合度与一 
个绝对拟合的基准线模型或一个未指定轨迹的模型的拟合 
度(见第2章的模型 11) 。 Byme 和 Crombie 讨论的另外两个 
前提假设(独立性与扰动项的同方差性)可以是潜变量增长 
曲线模型设定的通常方面，但并不是必需的。事实上，能够 
估计不同特定时点的扰动项方差被认为是潜变量增长曲线 
模型方法的一个长处，也是将潜变量增长曲线模型与自回归 
策略相结合的方法所要求的 （Curran &• Bollen , 2001； 
McArdle , 2001)。 
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第7节 | 参数估计与缺失数据 


传统的结构方程模型的参数估计是通过最大似然估计 
来实现的，使用这一方法时，需要假定测量的变量符合多元 
正态分布。对诸如潜变量增长曲线模型这类解释测量变量 
的协方差和均值的模型而言，数据常常是以从全部数据(数 
据有时不得不通过删除某些观测值或对某些缺失值进行估 
算的方法来保持完整)计算得来的样本协方差矩阵 S 和样本 
均值向量 y 的形式表示。矩阵 s 有 pxp 阶，包含: y 的 /) 个 
重复测量的样本方差与协方差。向量 F 包含/>个重复测量 
的样本均值。根据方程 1. 5和方程 1. 6的协方差与均值结 
构，总体协方差矩阵5：和均值向量 ft 是模型参数的函数。如 
果我们把方程 1. 5和方程 1. 6中所有的参数放到一个向量0 
中，那么参数估计的目标就是找到#中的参数估计值，从而 
使引申矩阵 S 和 (1 同 S 和？ 分别最为相近。在最大似然估 
计法中，这一最优性是用多元正态概率函数来定义的，即由 
最大似然估计法产生的一组参数估计，使似然函数的对数最 
大化时的 多为： 

InL =—^ ln 2 ^+ l n I S I 十 (y; —(O’lTHy, — ji)} 

“ i = l 


[1. 14] 
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J 6 r es k 0 g (1967) 将这一发展推广，可以证明 In L 在下列差异 
函数最小化时得以最 大化： 

= In | £ I-In | S |+ tr [( S — SIT 1 ] 

+ (y —— ji ) [1.15] 

因此，根据给定的 S 和 F ，用最大似然估计法寻找一个参数估 
计值的向量 f ，由这一向量产生的暗含矩阵 E 和 〆 见方程 
1. 5和方程 1. 6)使_?^最小化。请注意，如果2： = S 而 p = y 
(即模型完美地复制了数据），那么 PV 等于0。 . 

差异函数 &的最小化估计方法假定所有的样本数据都 
用来获得 S 和^如果有的数据缺失了(例如，个体是在不同 
时点测量的或某些个体在某些时点的数据未能得到），那么 
这一策略就不起作用了，因为从可用的数据计算得出的协方 
差矩阵不一定是内部一致的。幸好，我们有处理缺失数据的 
方法。上文提到的在多个测量时间组合情况下，多群体策略 
可以被看做处理缺失数据的一个一般的、基于模型的方法 
( T . E > Duncan &- Duncan , 1995； Marini , Olsen &- Rubin , 1979； 
McArdle Hamagami , 1992； R Muthen et aL , 1987)。 举例 
来说，如果某些个体是在时点1、时点2、时点3和时点5测量 
的而其他个体是在时点1、时点3、时点4和时点5测量的，那 
么可以设定一个两组模型，其中的每一组成员都有共同的测 
量时点。对于多样本分析，方程 1.15 中的差异函数可以被 
推广为一个多样本的表达式并被最小化，以使所有组同时获 
得最优拟合。 

在存在许多不同测量时间表的情况下，处理缺失数据的 
多组方法变得不现实。直到最近，这一局限一直是一个实实 
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在在的问题，因为实际中的纵向设计往往含有缺失数据。估 
计方法的发展允许模型被直接用于拟合原始数据，这使得在 
分析中包括不完整的个案变为可能。在涉及缺失(不完整) 
数据的情况下，完全信息最大似然 （ FIML ) 估计方法常常被 
推荐用于获得最大似然参数估计值。为适用于不完整数据， 
方程 1. 14中表示完整数据的似然对数可以被修 改为： 

InL =— {p i \n2n J r In | 21, |+ ( y ; — ( y ,. —(!,•)} 

[1.16] 

y , 是个体 i 的数据向量中可测量的部分, n , 和 5； 分别是模型 
的均值向量和协方差矩阵，其行和列对应个体：的数据 
( Arbuckle , 1996; Wothke , 2000 )。 FIML 估计法需要最大 
化这一函数。与填补或删除缺失数据的方法相比， FIML 能 
够取得较小的偏差和更有效的估计，而且当数据的缺失是完 
全随机时，还能取得无偏估计 （ Neale ， 2000； Rubin , 
1976) 。 [6] 与配对删除、列删除和缺失值估算比较， FIML 已 
经被证明具有更低的收敛失败率、更高的效率、较少的偏差 
和更准确的模型拒绝能力 （Enders & Bandalos ， 2001)。这两 
种方法的特性相似。实际上，当没有数据缺失时，它们是相 
等的。更清楚与深入的、关于 FIML 算法及其与其他模型相 
比较的描述，参见 E n ders (2001) 的著作。 

FIML 只是在出现缺失数据的情况下可以通过最小化差 
异函数来获得参数估计值的几种方法之一。其他方法包括 
将广义最小二乘法、未加权最小二乘法、 E - M 算法和渐进自 
由分布法运用于通过配对删除、列删除、单一或多重缺失值 
估算而转化来的“完整”数据。与这些方法相比， FIML 常常 
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是更好的。这是因为：（1)它用所有可获得的信息来估计参 
数； （2) 它不需要非常大的 数据； （3) 标准误可以由参数估计 
值的渐进协方差矩阵的逆矩阵获得。配对删除与列删除略去 
了一些数据，而配对删除更增加了碰到非正定的协方差矩阵 
的风险。此外, FML 现在已经是大多数 SEM 软件，包括 A - 
MOS(Arbuckle &- Wothke , 1999)、 MplusCL . K Muthen &• 
Muthen , 1998 — 2006)、 Mx(Neale et al . , 2003), EQSCBentler , 
1995) 和 LISRELCJoreskon &. Sorbom , 1996) 的标准估计选项。 
例如，在 LISREL 中，如果原始数据是输人数据，则 FIML 会 
被自动调用。缺失数据的问题在 Alli son (1987、2002) 中有 
更深人的描述。使用 FIML 估计法的主要缺点在于，如果有 
些数据缺失，就得不到所有 ml 的拟合指标 。 ra 
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第8节 I 模型评估与选择 


作为理论预测主要代表方法的模型设定和模型检验是 
现代经验科学实践的基础。在发展一个模型以拟合观测的 
数据时，关键在于设定的模型要准确地反映增长的具体理论 
预测或意涵 （ Collins ， 2006； Curran , 2000； Curran &• Hus - 
song , 2003； Curran &- Willoughby , 2003)。 此外，虽然这里 
的关注点是模型评估，但更好的做法往往是比较有竞争力 
的、源自理论的模型，而不是孤立地设定和评估模型。给定 
一个理论上可行的模型， LGM 可以通过评估包括截距和斜 
率因子的均值以及变化方面的方差与协方差等模型参数的 
统计或实践显著性来检验该模型。一个关于参数显著性的 
非正式的检验是用点估计值除以它的标准误，如果这一比率 
超过 2. 00(1.96 在大样本的情况下），那么这个参数估计值 
就被称为“在 0. 05的置信水平上与0显著不同”。 

在 SEM 中，整体模型的拟合度也可以被评估。实际上， 
好的总体拟合度常常是理解参数估计值的先决条件。 [8] 在多 
元正态分布和完全拟合的原假设下，戶地 X ( N -1 ) 是一个 
自由度为 [Mf + 3)/2] — f 的卡方分布， p 是变量的数目， 
而 V 是自由模型参数的有效个数。 [9] 这个卡方值是一系列 
用来估计模型的预测值与观察数据之间匹配度的拟合指标 
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的基础。除此之外，我们推荐在几个 SEM 程序中都有的近 
似误差均方根法 （ RMSEA ) (Browne Cudeck ， 1993； 
Steiger 8^ Lind , 1980) : 

I maxi ( Fm . —0! 

RMSEA = a /^^—■~ df Jl — 1 - [1.17] 

方程 1. 17 中根式下的分子是总体模型不适度(拟合差异)的 
估计。因此，根式下的数量表示估计的每个自由度的总体模 
型误差，所以值越小就越好。 RMSEA 是总体不适度的估计 
而不是简单的样本不适度的测量，因此被认为是较好的指 
标。重要的是，我们可以获得 RMSEA 的置信区间，为这一 
拟合指数提供点估计之外的一个精确度的测量。 

因为以卡方为基础的指数常常存在于近乎不可逆矩阵 
( Browne . MacCallum ， Kim , Andersen &■ Glaser , 2002)、 违 
反分布的假设 （ Curran , West Finch , 1996) 和大样本数 
(Tucker &• Lewis , 1973) 相关的问题，所以最好检查 S 与 f 
对应元素间的简单残差。一个常用的、只基于残差的指数是 
标准化残差均方根 ( SRMR ) (JSreskog & Sorbom , 1996)，即 
一个关于残差大小的概括量度。 SRMR 是观测相关与模型 
方差和协方差矩阵所显示的相关之间的绝对差的平方均值 
的平方根(因此是越小越好)。同 RMSEA —样， SRMR 也被 
许多 SEM 软件列为默认的输出，但要记住， SRMR 只评估协 
方差结构的拟合度。 

另一类拟合指标反映的是一个特定的模型与一个恰当 
设定的空模型(见第2章的模型 0) 之间的拟合度差异。这类 
拟合指标的一个例子是非基准拟合指数 ( NNFI ) (Bentler &- 
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Bonett , 1980； Tucker & Lewis , 1973) : 


NNFI = minJ 


2 2 
1 —i 
J/o df k 


dh~ 


[1.18] 


■^与 df 。 是由空模型计算而来的，而 K 与则是在研究 
模型的基础上计算而来的。 NNH 已经被证明在分布假设被 
违反的情况下仍然比较稳健 (Lei & Lomax , 2005)。我们在 
下一章将详细讨论恰当的空模型。在本书中，我们为所有拟 
合的模型报告卡方、 RMSEA 、 NNFI 和 SRMR 估计值。 

除了孤立地评估模型，我们也可以用一种模型选择策略 
来评估嵌套模型或非嵌套模型的相对拟合度。如果一个模 
型(模型 A ) 的估计参数是另一个(模型 B ) 的估计参数的子 
集，则称前者嵌套在后者中。也就是说，如果对 B 中的某些 
参数加以限制而得到 A ， 那么 A 就嵌套在 B 中。当一部分数 
据缺失时，有的拟合指标，如 GFI 与 SRMR ， 就不能计算了 
( Enders , 2001)。在模型之间没有区别的原假设下,完全数 
据时的卡方值差异 ( AX 2 ) 或不完全数据时一 21 nL 值的差异 
本身符合卡方分布，其自由度等于要估计的参数数目的差 
异。 对于非嵌套的模型，利用信息的模型选择方法(如赤池 
信息准则、贝叶斯信息准则)可以用来选择模型。 
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第9节 | 统计效力 


同绝大多数推论统计的应用一样，统计效力在 LGM 中 
是很重要的。效力指的是正确否决一个错误的原假设的概 
率。在 LGM 中，原假设是研究者的潜变量增长曲线模型，所 
以效力就是当研究者的增长模型不适用于总体情况时，它被 
否决的概率。 LGM 模型往往在总体中不都是那么正确，所 
以一个高水平的统计效力会导致对非常好但并不完美的模 
型的否决。这种对好的模型的否决在实践中当然是不受欢 
迎的，但这是似然比检验模型拟合度的一个众所周知的局 
限。在实践中，为了补救这种情况，可以使用前面所讨论的 
各种描述性拟合测度，而不是仅仅专注于似然比检验模型拟 
合度。 

MacCallum、Browne 与 Sugawara ( 1996) 描述了 一■种涉 
及 RMSEA 拟合指标的统计效力（给定样本量)或最小必须 
样本量(给定所需的效力水平）的估算方法。研究者选择分 
别反映好拟合 ( e 。) 与差拟合 ( e A ) 的 RMSEA 值的原假设和备 
择假设。例如，完全拟合的检验可能会选择 e 。 = 0. 00 (完全 
拟合)和 = 0.08( —般拟合)。而一个严格拟合的检验可 
能涉及 e 。 = 0. 05 (精密拟合)和= 0. 10 (不可接受拟合)。 
作者提供的 SAS 程序会提供在一个给定的效力水平上拒绝 
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一个差模型的最小必须样本量 N 、 模型自由度以及用 
RMSEA 表示的代表好拟合与差拟合的原假设及备择假设。 
与之相反，他们的程序也提供在给定的 N 和模型自由度的情 
况下，一对原假设与备择假设相对应的统计效力水平。 

除了拒绝一个差模型的效力之外，我们也应当考虑检验 
非零参数的效力。这类效力是 LGM 中一个几乎没有研究过 
的课题。一个例外是 Hertzon 等人 (2006) 最近的一个研究。 
他们发现检验并行过程潜变量增长曲线模型(见第2章的模 
型 7) 的斜率协方差的功效在很大程度上依赖于效应大小、重 
复测量的次数、增长曲线的可靠性以及样本量。 
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第1节 I 数据 


接下来，我们将示范在实践中如何使用增长曲线模型。 
在示范中，我们将使用国家儿童健康与人类发展研究院 
( NICHD ) 的早期儿童照料与青年时期发展研究 ( NICHD 早 
期儿童照料研究网络， 2006) 的数据。将研究问题量化之后 
对父母一子女关系的分析为解决类似的问题提供了 一个相 
对客观的方法。大量的研究检验了这些亲子关系与诸如吸 
烟或饮酒(如 Blackson , Tarter , Loeber , Ammerman &- Win - 
dle , 1996)、 自我约束能力(如 Wills et al . , 2001) 和青少年怀 
孕 ( Miller，Benson &- Galbraith , 2001) 等结果的联系。研究 
发现，良好的父母一子女关系与儿童正面的发展相关联，但 
某一时刻的父母一子女关系与其后的测量结果的相关性往 
往不是很强。父母一子女关系缺乏理想的有效预测,其诸多 
原因中的一个就是这些关系随时间变化。心理动力学 
( Freud , 1958)、进化理论 （ Steinberg ，1989) 和社会一认知 
( Smetana , 1988) 的各种理论观点都预测随着子女的成熟，父 
母一子女关系将会发生变化，尽管变化的原因不同。研究父 
母一子女关系随时间的变化为增强预测准确度提供了额外 
的机会，并且能增强我们对父母一子女的互动如何影响儿童 
和青少年的不良行为的理解。 



第 2 章将潜变置增长曲线模型应用于经验数据 


35 


表 2.1 母亲对子女亲密度数据的描述统计 



整个样本 


男孩 



女孩 


午级 

样本数 

均值 

标准差样本数 

均值 

标准差样本数 

均值 

标准差 

不完整数据的案例 








1 

1016 

37. 96 

2.56 

508 

37.73 

2. 77 

508 

38. 20 

2.30 

3 

1025 

37. 19 

2. 82 

508 

37.07 

2 . 73 

517 

37.32 

2 . 90 

4 

1022 

36.96 

3.33 

516 

36. 62 

3. 53 

506 

37. 31 

3. 08 

5 

1018 

36.56 

3.25 

506 

36.65 

3.34 

512 

36. 77 

3.16 

6 

1024 

36.18 

3. 56 

512 

35. 93 

3.63 

512 

36.42 

3.47 

完整数据的案例 








1 

851 

37.95 

2.53 

417 

37.76 

2.66 

434 

38. 14 

2. 38 

3 

851 

37.28 

2. 74 

417 

37.20 

2. 62 

434 

37.35 

2.86 

4 

851 

37.05 

3.28 

417 

36. 74 

3. 45 

434 

37. 34 

3.07 

5 

851 

36. 57 

3.21 

417 

36.34 

3. 31 

434 

36.79 

3.09 

6 

851 36. 14 

3. 59 

417 

35. 84 

3. 73 

434 

36.42 

3.43 


表2,2母亲一子女亲密度 :完整 数据的均值与协方差 < iV = 851} 


年级 

均值 

协方差 




1 

37. 9542 

6. 3944 




3 

37. 2785 

3.2716 

7. 5282 



4 

37 . 0463 

4. 1435 

6. 0804 

10. 7290 


5 

36. 5696 

3. 7058 

5. 1597 

6. 5672 

10. 2920 

6 

36. 1363 

4. 1286 

5. 7608 

7, 2365 

7. 6463 12. 9085 
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图 2.1 平均亲密度分数(误差条代表一个标准差的宽度) 
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我们从父母一子女关系量表中挑选了两个复合测度。 
具体来说，15个学生一教师关系量表 (Pianta, 1993) 中的等 
级尺度项目被用来评估子女对父母依恋的程度。每一个项 
目都在1到5的量表上打分，1表示“完全不适用”，而5表示 
“完全适用”。这些项目被用来建构四个复合测度，分别是父 
母与子女的冲突度 (CNFL) 和亲密度 (CLSN)。 这些变量是在 
小学一年级到六年级(二年级时没有收集数据)时测量的。母 
亲一子女亲密度是绝大多数将要展示的模型中的主要重复测 
度变量。与这些关系测度一起，一个组群变量(子女的性别） 
被选中，以便我们展示如何在纵向模型中包括组群。我们抽 
出所有至少有一个有效 CLSN 分数的儿童的数据，得到一个 
包含1127个儿童 (571 个男孩与556个女孩)的样本并分析所 
有在所关心的变量上有完整数据的个案。 [M] 表 2. 1给出了描 
述性的信息;图 2. 1给出了 CLSN 的平均 分数; 最后，表 2. 2给 
出了样本中851个完全数据个案的观测协方差矩阵与均值。 
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第2节 | 软件 


以下展示的模型是用三种软件包来估计的。我们使用 
LISREL 8. 8 (Joreskog &■ Sorbom ， 1996 )、 Mx 1. 1 (Neale et 
al . , 2003) 和 Mplus 4. 2( L . K . Muthen & - Muthen , 1998 — 
2006)。 还有其他易于分析增长曲线模型的软件包，如 
AMOS 与 EQS 。 其中，作为一个灵活的、没有版权限制并能 
免费下载的软件， Mx 特别实用。在本书写作时，能够估计本 
书中所有模型的一个免费学生版的 LISREL 可以从 SSI 的网 
站上获得。 L 11 ] Ferrer、Hamagami 与 McArdle (2004) 提供了 
一个在各种软件中设定增长曲线模型的指南。 
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第3节 | 模型拟合策略的概要 


一个对重复测度问题的 LGM 的典型应用包含变量在两 
个分析层上的测量。第二层单位是研究的实体常常是(但并 
不一定是)个人。第一层单位是在每一个第二层单位上获取 
的重复测度。其他变量可以是在第一层或第二层上的测度。 
第一层变量包括结果变量以及其他在同一时点测量的变量。 
被重复测量并用于预测所有结果变量、同时在重复测度之间 
具有差异性的变量叫做“时变协变量” ( TVC )。 第二层的变 
量表示第二层单位的特性，因此它们在个人间不同而不随时 
间变化。这样的例子包括性别、环境变量或稳定的性格特 
征。第二层的自变量常常被称为“非时变协变量”。截距或 
斜率因子的变化性可能会由非时变协变量来 解释。 举例来 
说，一个研究者可能对随着儿童的成长，父母对母亲一子女 
亲密度的理解的变化感兴趣。研究者可能在某几个时点从 
同一批父母那里收集数据并尝试为随时间变化的亲密度建 
模。对于这一模型，这位研究者可以选择将时间标度的零点 
放在第一个测量时点，然后再对同一批儿童收集四次数据。 
如果研究者发现不同儿童的轨迹(截距与斜率）明显不同，可 
能会试图研究是否性别差异能够解释部分的个体间差异性。 
因此，这位研究者可以引人性别作为最初水平(截距因子)和 
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变化速度(斜率因子），或两者共同的一个自变量。在这里， 
性别是一个非时变协变量，因为它在第二层单位(儿童)之间 
而不在第二层单位内部变化。 

特别对于像 LGM 这样灵活的方法，在尝试用模型拟合 
数据之前，设定一系列根植于理论的、用于检验的模型是有 
帮助的。然后我们可以按照特定的顺序，检查一系列先验 
的、理论上合理的模型。当更复杂的模型已经不再能显著地 
提高模型的拟合度时，我们就得出以下 结论： 已经找到一个 
可接受的模型。在下一节中，我们将展示这一过程。 
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第4节 | 模型0:空模型 


“空模型”这一说法通常是用来指比较不同假设模型的 
一个基础。 LGM 中的空模型与典型的 SEM 应用中的空模 
型不同。在典型的 SEM 应用中，空模型是一个测量变量之 
间没有任何预测关系的模型，模型中也没有潜变量，只有方 
差参数被估计。然而，在 LGM 的背景下，我们把空模型定义 
为一个随时间推移而没有变化并在总体平均水平上没有差 
异性的模型 (Widaman & Thompson, 2003)。只有平均水平 
(截距 m) 和一个共同的扰动项方差(氏)被 估计： 


A, = . 

_ 1 _ 

屯= [0] 
a = [ai ] 

% 

0 ••• 

® e = 

o o e E 


[ 2 . 1 ] 


[ 2 . 2 ] 

[2.3] 


[2.4] 
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这里，乂是一个表示每一个我们测量时点截距因子的固定 
负载的 5 X 1 矩阵。假定这个模型随时间推移不发生变化， 
所以斜率因子就被省略了。矩阵 V 是一个包含截距方差的 
1 X 1 矩阵，在这一模型中，截距方差被设定为0。钗是一个 
所有对角元素被限定为相等的5 X 5对角矩阵。这一相等的 
限定表示同方差性的假设。 [12] 最后， (X 是一个包含估计的整 
体均值奶的 1 X 1 矩阵。如果空模型不适合数据(它常常是 
这样的），常常要估计截距的方差，并将一个线性的斜率因子 
纳入模型以表示随时间推移而发生的变化。根据一个先验 
的理论指导或一个更具探索性的方法，截距和斜率的自变量 
也可以被纳人。这个简单的两参数的模型或一个与它尽可 
能相近的模型将作为本章其他部分计算 NNFI 时的空模型。 
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第5节 | 模型1:随机截距模型 


随机截距模型是潜变量增长曲线模型的一个最简单的例 
子。在 LGM 中，随机截距模型相当于一个加人均值结构的单 
因素验证性因子分析 ( CFA ) 模型，其中的所有因子负载都被 
设定为 1， 而所有的扰动项方差都被限定为相等(见图 2. 2)。 
参数的矩阵同方程 2. 1、方程 2. 2、方程 2. 3与方程 2. 4中设定 
的一样，只是屮 =[ 如]，对应整体水平上的个体间差异性。 


1:随机截距模型 

f 07) = 661. 09, p< 0.0001 
RMSEA = 0. 23, Cl.so : 0.22, 0.25 



注: CLSN= 母亲一子女亲密度。 

图 2. 2 —个表示随机截距模型的路径图 


当我们使用 LSREL 且用模型1拟合表 2. 2的数据时， 
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我们得到了表 2. 3中的参数估计值。结果表明存在显著 
的、未得到解释的个体内方差（瓦)与个体间方差(如）。在以 
上两种情况中，这些参数的显著性都可以从它们的大小相对 
于它们的标准误都超过了 2 : 1的比率看出来。显著的差异 
性为拟合更复杂的模型(如加入时变与非时变协变量)提供 
了依据。 


表 2. 3 

模型1:随机截距模型 

参 数 

估计值 

平均截距心 

37. 00(0.09) 

截距方差 

5, 27(0. 30) 

扰动项方差& 

4. 68(0.11) 


注 :括号 中的数字是参数估计值的标准误。 


同时，与图 2. 1暗示的结果一致，拟合度的参数也显示 
随机截距模型没有令人满意地拟合数据。卡方检验在 f < 
0. 0001的水平上拒绝了这一模型， RMSEA 的值远远超过了 
可以接受的范围（大约小于 0. 08), 而且模型具有很大的残 
差。非常明显 r 一个只有截距的模型是不适合母亲一子女亲 
密度的数据的。接下来，一个线性截距因子被加入到模型 
中，以表示图 2. 1中观测到的大致的线性趋势。 
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第6节 | 模型2:固定截距、固定斜率 


在模型2中，我们把截距与斜率都固定，表示只估计一 
个唯一的、平均的截距参数 ( A ) 与线性斜率参数(&)，并忽 
略任何变化方面的个体间差异性。我们通过在 A , 中增加一 
列来包括斜率。这一列现在表示斜率因子并反映了数据的 
两个 特性: 第一，对应于一年级测度的负载被编码为0,使时 
间原点定在一 年级; 第二，列中元素的间距反映了在二年级 
没有测度时的情况。因此，虽然第一个测度与第二个测度之 
间的时间是第二个测度与第三个测度之间时间的两倍，但由 
于时间编码的方式（见方程 2. 5)，模型仍然反映了线型的 
增长。 

图 2. 3描述了模型2中设定的潜变量增长曲线。用矩 
阵表示截距与斜率因子，它们的方差、协方差以及平均值 
如下： 


A， = 


On 


[ 2 . 5 ] 
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-0 -] 

平= [2. 6] 

Lo 0 」 


-ai - 

a = 

-Ctz - 

% 

0 

0 e = • 

0 0 d £ 

因为截距与斜率都是固定的，所以它们的方差与协方差 
都被限定为 0( 因此平包含的都是0)。同模型1 一样，矩阵 
0 £ 也被限定用来表示扰动项方差相同的假设。 


[2-7] 


[ 2 . 8 ] 


2:固定截粗、固定斜率 


4:随机截距、随机斜率 


^(17) - 2 094. 41 ,多 <0. 0001 
RMSEA =0. 45, C1 . 90 ： 0.44, 0.47 
NNFI = 0. 02 
SRMR = 0. 49 

3:随机截距、固定斜幸 


f(14) = 75. 90, p<0. 0001 
RMSEA = 0. 07, Cl . 9o ： 0.06, 0.09 
NNFI = 0. 96 
SRMR = 0.06 


S: 多群体分析 



CLSN 

CLSN 

CLSN 

CLSN 

CLSN 

G1 

G3 

G4 

G5 

G6 



注: CLSN = 母亲一子女亲密度。 


困 2. 3表示具有随机截距、随机斜率、截距一斜率协方差和 
相同扰动项方差的一般线性潜变置增长曲线模型的路径图 
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表 2.4 

模型2:固定截距、固定斜率 

参 数 

估计值 

平均截距趴 

38. 00(0.09) 

平均斜率 A 

-0. 36(0.03) 

扰动项方差仏 

9. 57(0.21) 


注: 括号中的数字是参数估计值的标准误。 


表 2. 4与图 2. 3描述了模型的结果。新的斜率参数估 
计值是显著的负值，反映了母亲与子女间的亲密度在小学 
阶段随时间的推移而降低的事实。但是，模型2的拟合度 
(见图 2. 3) 比模型1的拟合度差很多。这一较差的拟合度来 
自截距与斜率因子设定的方式。模型2使用固定的截距与 
斜率。它限定每一对母亲一子女都有相同的起始亲密度，并 
强制每一对的亲密度都以恰好相同的速度降低。人与人之 
间显然是不同的，但这一模型并没有考虑到这一点。从另一 
个角度来看，这一拟合不足的原因在于，固定截距模型意味 
着方差的个体间部分(组内相关系数，即 ICC ) 为0。数据中 
ICC 偏离0的程度决定了固定截距模型拟合更差的程度 。一 
个暗含非零 ICC 的随机截距模型能够解释重复测度间的部 
分自相关。我们先通过放松对截距方差的限制，或者说“解 
放”截距(模型 3) 来解决这一问题，然后再同时解放截距与斜 
率(模型4)。 
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第7节 | 模型3:随机截距、固定斜率 


我们有理由怀疑并不是每一对母亲一子女在一年级时 
都有同等的亲密度。但是，先前的固定截距模型的设定却是 
这样假定的。虽然我们在拟合模型1时解放了截距，但是当 
我们把年级以斜率因子负载的形式引人后就又将其固定了。 
一个更实际的模型会通过允许截距的方差被自由地估计来 
允许个体在截距上有所不同。这一略微修改的模型通过估 
计一个平均截距 ( A ) 和一个表示个体的方差相对于总体平 
均方差的变化程度的截距方差 （fu ) 来表示个体在截距上的 
差异性。模型3的参数估计值(见表 2. 5) 与模型2的相似， 
母亲与子女亲密度的平均变化大约是每年级一 0. 36个单位 
而平均的截距大约是38。截距的方差 （4^ = 5. 37) 是显著 
的，显示个体在初始状态有明显的差异。允许个体的截距是 
随机的——只解放了模型2中的一个参数——显著地提高 
了模型的拟合度。如我们所料，这一模型的拟合度比前面的 
固定截距模型要好得多， AZ 2 (1) = 1797。 [14] 但是，正如显著 
的扰动项方差（良 =4. 21 ) 所示，模型仍然有提高的空间。正 
如有理由假设儿童在一年级的初始状态是不同的,我们同样 
有理由假设每一对母亲一子女的亲密度随时间推移的变化 
速度也是不同的。 
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表 2 .S 

模型3:随机截距、固定斜率 

参 数 

估计值 

平均截距 A 

38. 00(0. 10) 

平均 斜率仏 

-0. 36(0. 02) 

截距方差 fU 

5. 37(0.30) 

扰动项方差 A 

4. 21(0.10) 


注 :括号 中的数字是参数估计值的标准误。 


请注意，模型3的平均截距和斜率的估计值与模型2相 
同，我们所做的只是允许围绕平均截距的个体差异性存在。 
有趣的是，模型3中截距方差与扰动项方差之和等于模型2 
中的扰动项方差。在模型2中，截距的方差被限定为0,迫使 
所有的个体间差异以扰动项方差的形式表现。在下一个模 
型中，截距和斜率都被允许有所变化。 
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第8节 | 模型4:随机截距、随机斜率 


到现在为止，我们所展示的都是如何拟合只有固定斜率 
的模型。但是 ，一 般而言，个体间在基线水平和变化的速度 
上都会有差异。我们先前的每一个固定参数模型都忽略了 
部分个体的差异性。为了更好地反映数据的本质，我们现在 
设定截距与斜率方差参数都是随机的。在模型4中，每一个 
个体都被允许有不同的斜率和不同的截距。 [15] 这一模型除 
了在更多的情况下更为实际外，还允许对截距一斜率的协方 
差(如 ） 进行估计。在我们的例子中，截距一斜率的协方差指 
的是一年级时，母亲一子女亲密度与随时间推移的变化速度 
的相关程度。 

同先前的模型一样，模型4的 LGM 的表述是较为简单 
的。为了设定这一模型，我们解放截距与斜率因子的方差并 
添加一个截距一斜率协方差参数。矩阵少因此 变为： 

r^n n n 

W = [2. 9] 

-<pzi - 

用 LISREL 估计模型 4 中的参数得到表 2. 6中的估计值。截 
距的方差相对于斜率的方差而言较大，而截距一斜率的协方 
差 (0. 25,对应于 0. 40的相关系数)是显著的。这表明有较 
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高截距的儿童的负斜率较小，或者说在一年级时更高的母亲 
与子女的亲密程度的下降速度，比那些在一年级时不那么高 
的母亲与子女亲密程度的下降速度慢。 


表 2. 6模型4:随机截距、随机斜率 


参 数 

估计值 

平均 截距仏 

38. 00(0.08) 

平均斜率 A 

-0. 36(0.02) 

截距方差^ 

2. 98(0. 29) 

斜率 方差& 2 

0. 14(0. 02) 

截距/斜率协方差 ^ 21 

0.25(0. 06) 

扰动项方差良 

3. 70(0.10) 


注: 括号中的数字是参数估计值的标准误》 


卡方差异检验显示，这个具有随机截距和随机斜率的模 
型的拟合度比只有一个随机截距的模型3的拟合度有显著 
的提高， AZ (2) = 221.5, p < 0 . 0001。 RMSEA、NNFI 与 
SRMR 拟合指标同样都显示了好的拟合。如前所述,截距与 
斜率间的显著正协方差意味着在一年级时更亲密的母亲一 
子女往往较少经历亲密度的大幅下降。 

在读者作出与其母亲有更亲密关系的儿童在剩余的小 
学学年中，亲密度只会较小地下降的结论之前，请回顾一下 
我们关于截距一斜率协方差（如）解释的评论 :必须 注意的 
是，如果零时点被定在其他的年龄，截距一斜率协方差可能 
远没有这么令人印象深刻。譬如，大部分被选中的儿童在上 
幼儿园时有相同的母亲一子女亲密度，当时间在一年级对中 
时，仅仅截距的不同就会导致我们观测到的协方差。实际 
上，如果我们重新调整年龄变量，从而使截距定义在一年级 
之前的两年，我们就会得到一个一 0. 03的不显著的截距/斜 
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率相关度。这突出了在拟合一个模型时决定将时间刻度的 
原点放在何处的重要性。 

Mehta 与 West(2000) 指出，如果线性 LGM 是数据的一 
个合适的模型，那么重复测度的真实分数的方差就会遵循一 
个二次的模式。用 Z 表示时间，^表示时间原点，得 到： 

%,) = Ipn ~\^ Ip22 (t — t* ) z + 2 ipn (t 一 t* ) [2. 10] 

在这里, <4, 是《时的真实分数方差，如、如和如分别是总体 
截距方差、斜率方差和截距一斜率协方差。换句话说，个体 
轨迹的集合就像一条蝶形领结或是扇形。在很多情况下，个 
体间的差异性在哪一点得到最小化(领结的“结”)是我们感 
兴趣的。这一点被 Hancock 与 Choi( 2006 ) 称为“孔径”，可简 
单地通过选择最小化截距方差的时间原点计算 出来： 


在这里， a 1 * 是最初选定的时间原点的时点，^21与^22分别是 
估计的截距一斜率协方差与斜率方差。 [16] 孔径是如= 0时 
的那一点 (Mehta & West , 2000)。用模型4中的结果，儿童 
在母亲一子女亲密度上最相近的时点是 a - 0 - 0. 2533/ 
0. 1366 =- 1.85, 即进人小学的前一年。当然，当孔径落在 
观测到的数据的时点范围内时,我们就应当谨慎解释，因为 
这就迫使研究者假设线性模型适用于这些时点，而这并不一 
定成立。 

总结我们以上的讨论,我们从佔计一个空模型发展到估 
计一个有随机截距与随机斜率的 模型。 随机截距模型(模型 
1) 表明，绝大多数的差异发生在个体内部，但个体之间也有 
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不可忽视的差异性存在。模型2显示,当个体间差异被忽略 
时，我们可以发现什么，以及当不同的个体的结果测度有不 
同的变化轨迹时，将参数限定在某一特定值时会如何损害模 
型的拟合度。模型3基于模型2,解放了截距方差参数。我 
们发现，允许不同的人有不同的截距导致了模型拟合度的大 
幅提髙。具有随机截距与斜率的模型(模型《比先前限定更 
多的模型(模型2与模型 3) 表现得好得多。除了提高整体拟 
合度外，模型4的优势在于发现了截距与斜率间的一个显著 
的正协方差(如），这表明亲密度随时间推移而变化的速度与 
一年级时的亲密度有关。我们将模型4作为接下来研究的 
模型的基础。在模型5中，我们检验了母亲一子女亲密度变 
化轨迹存在性别差异的可能性。 
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第9节 I 模型5:多群体分析 


模型4的结果表明，假设个体具有不同的截距与斜率是 
有意义的。然而，这部分的差异有可能与其他变量有系统性 
的相关。例如，我们可以假设和检验男孩与女孩在平均截距 
与斜率上的群体差异 (McArdle &■ Epstein , 1987) 0 至少有 
两种方法来检验群体在轨迹上的差异： （1) 把样本分成两组， 
然后在两组中同时估计 参数; （2) 把群体变量设定为截距与 
斜率的自变量。在 LISREL 中，设定一个双群体分析需要将 
数据根据性别分为两个数据集，并进行一个多样本分析。在 
这一分析中，模型被同时拟合到两个数据集中。两个模型用 
相同的程序命令设定，每一个模型都如图 2. 3中所描述的那 
样。不同群体模型的参数矩阵中的重要参数被加上相等的 
限定，以检验各群体在这些参数上存在差异的假设。这一多 
群体分析的方法原则上可以被运用于任意数量的群体，而不 
同的群体也可以设定不同的模型形式。正如我们下一章要 
讨论的，这一方法使我们能够以一种新颖的方式来研究纵向 
设定下的实验效应以及初始状态与实验的交互效应。而用 
群体作为自变量的方法将在模型6中进行讨论。 

我们把多群体的策略运用到亲密度数据上，对男孩组与 
女孩组同时拟合分别的模型，但并不设定跨群体的模型参数 
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限制，其结果显示在表 2. 7中。其中， NNFI 是根据每个群体 
的双参数空模型分别计算的。模型拟合度一般 (RMSEA = 
0.088, 90%的置信区间= {0.072, 0. 104}), 表明允许对参 
数估计值进行谨慎解释。男孩组与女孩组的所有参数估计 
值，除了女孩组的截距一斜率协方差（如 =0.14) 外都显著， 
这个值比男孩组的值 (^i=0.36) 明显低得多。与这些协方 
差所对应的相关系数分别是 r = 0. 22( 女孩组）和 r = 0. 59 
(男孩组），表明在初始状态（一年级时）和随时间变化的母 
亲一子女亲密度的相关程度上，男孩比女孩要高得多。 


表 2. 7 模型 5 :多群体分析 


参 数 

估计值 

男孩 


平均截距 A 

37. 85(0. 12) 

平均 斜率心 

一0_ 38(0. 03) 

截距方差 fn 

3. 03(0.42) 

斜率方差 〆 22 

0. 12(0. 03) 

截距/斜率协方差 

0. 36(0. 08) 

扰动项方差良 

3. 78(0. 15) 

女孩 


平均截距 A 

38. 14(0. 11) 

平均 斜率心 

-0. 33(0. 03) 

截距方差 fu 

2. 90(0. 39) 

斜率方差022 

0. 15(0.03) 

截距/斜率协方差 & i 

0. 14(0. 08) 

扰动项方差良 

3. 63(0.14) 


请注意，男孩组的截距与斜率(分别是 37. 85和一 0. 38) 
比女孩组的(分别是 38. 14和一 0. 33) 斜率低。这表明平均 
而言，男孩似乎比女孩起点低，而下降的速度快。考虑到这些 
明显的差别，研究者有充足的理由来检验这些差别是否显著， 
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一个方法就是限定这些跨群体的参数相等，然后通过卡方差 
异检验来观察模型的拟合度是否有显著的下降。在这里，如 
果我们限定截距的均值相等(允许斜率变化)，差异检验的结 
果就是 AI 2 (1) = 3. 11 ， f = 0. 08,表明截距没有显著的不同。 
如果我们改为限定斜率的均值相等(允许截距变化)，差异检 
验同样也是不显著的，即 AZ 2 (1) = 1. 47, p = Q . 23,表明斜率 
也没有显著的不同。尽管看起来有区别，但并没有足够的证 
据表明男孩与女孩在一年级到六年级间的母亲一子女亲密度 
上遵循不同的线性轨迹。当然，检验其他跨群体限制条件同 
样也是可能的，但理论可能会建议检验扰动项方差或截距一 
斜率协方差(如）的区别。关于男孩组与女孩组釦相等的假 
设,其检验也是不显著的，即 M 2 ( l ) = 3.83, p >0.05。 

关于多群体 LGM 的例子和进一步的讨论，见 Curran , 
Harford 与 Muthen ( 1996 ) , Curran 、 Muth 6 n 与 Harford 
(1998), McArdle (1989) 和 McArdle 与 Epstein (1987) 的著 
作。在这一节结束时，我们有必要指出，我们的研究假设群 
体的成员资格是已知的(可观察到的)。如果群体是假定的， 
同时其成员资格是不确定的，那么研究者可能会对第3章讨 
论的增长混合模型感兴趣。接下来，我们将展示对于亲密度 
变化轨迹的性别差异研究的另一种方法。 



潜变置 增长曲线横型 


第10节 | 模型6:条件増长曲线模型 


除了使用多群体模型，对截距与斜率的性别差异分析可 
以通过在一个单组分析中，将性别作为截距与斜率的外生变 
量(第二层单位或非时变协变量)来大大简化模型。这样的 
随机变量的自变量能够被引人模型，来解释个体间截距与斜 
率估计值的差异。方差参数在模型3与模型 4 中被解放。 
因为截距与斜率的方差可以被看做未得到解释的个体差异， 
这种分类或连续的第二层变量有可能解释这些差异。这类 
模型有时被称为“条件 LGM M (Tisak &• Meredith , 1990； 
Willett &- Sayer , 1994) ，而模型 1 到模型5则可以被称为“无 
条件 LGM”(Singer & Willett , 2003)。虽然我们只选择性别 
作为自变量，但实际应用中可以选择任意数量的自变量，如 
测量个体在种族、社会经济地位或父母的宗教信仰等方面的 
差异的变量。与模型5相比较，模型6—个明显的优势就 
是，因为不需要把样本分成几个群体，非时变协变量既可以 
是名义变量(如这里的性别），也可以是连续变量。但其中一 
个不足就是，研究者必须能够假设某些跨群体的模型参数不 
变。譬如，我们在模型5中可以自由地估计男孩组和女孩组 
的不同扰动项方差，但在模型6中，我们就要投人许多额外 
的努力才能做到这一点。 



第 2 章将潜变麗增长曲线模型应用于经验数据 


57 


我们在模型6中展示了运用分组变量（性别）作为自变 
量的方法。在这一模型中，我们用一个固定系数岛使性别成 
为截距的一个自变量，这一系数被解释为性别对截距的平均 
效果。 [17] 性别同样以固定系数 A 为参数，作为斜率的一个自 
变量。当一个非时变协变量被当做斜率的自变量时，其效应 
常常被称为“跨层交互效应”，因为时间（第一层）与协变量 
(第二层)互相影响，共同预测重复测度 (Cronbach & Webb , 
1975； Curran , Bauer &- Willoughby , 2004； Kreft de 
Leeuw ，1998; Raudenbush &- Bryk , 2002) 0 注意，如果年龄 
对母亲一子女亲密度的影响在个体间是不同的，而性别部分 
地解释了个体在这一影响上的差异，那么跨层交互效应与传 
统的多元回归分析中的调节效果就有同样的解释。 [18] 

图 2. 4是一个包括性别作为截距与斜率的自变量的路 
径图。截距与斜率的方差以及它们的协方差被重新概念化 
为残差方差与残差协方差，即性别未能解释的那部分方差与 
协方差。在图 2.4 中，这些残差参数即如、如与如。参数 
A 和 A 分别表示性别对截距和斜率的影响。这一模型的结 
果展示在图 2. 4和表 2. 8中。 NNFI 是将模型0作为空模型 
计算出来的，因为估计性别的均值和方差得以提高。 

模型6的结果显示，性别预测截距的系数是一 0. 29,也 
就是说，在一年级时，母女(编码为 0) 比母子(编码为 1) 的亲 
密度分数高，但这一差异并不显著。母女也比母子表现出较 
少的随时间发生的变化，虽然也不显著。正如我们所预期的， 
这些结果同我们从模型5中得到的一致。例如，男孩和女孩 
的平均截距的差异(见表 2. 7) 是 37. 85—38. 14 =-0. 29,等于 
模型6中所估计的性别的固定效应 A (见表 2. 8)。同样，模 
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潜变量增长曲线模型 



6:条件增长曲线模型 

/(17) =81.65, p< 0.0001 
RMSEA = 0. 07, C1. M: 0. 05, 0.08 
NNFI = 0. 96 
SRMR =- 0. 05 
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注 : CLSN = 母亲一子女亲密度。 


图 2.4 以性别自变置预测截距与斜率的个体差异的模型的路径图 


表 2. 8模型6:条件增长曲线模型 


参 数 

估计值 

平均截距 A 

38. 14(0. 11) 

平均斜率& 

_ 0. 33(0. 03) 

性别对截距的影晌多丄 

-0. 29(0.16) 

性别对斜率的影响多 2 

一 0. 05(0.04) 

截距方差 fn 

2. 96(0. 28) 

斜率方差4?22 

0.14(0. 02) 

截距/斜率协方差 p 21 

0. 25(0. 06) 


注:括号中的数字是参数估计值的标准误。 


型5中的平均斜率差异是一 0. 05,等于模型6中得到的性别 
对斜率的固定效应由于模型5和模型6并不完全相同 
(跨群体间的扰动项方差不同），结果不一定总是这么相近。 
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我们须注意，这里的结果可以通过增加一个跨群体相等的限 
定而轻易改变。 

把非时变协变量当做增长因子的自变量可能存在问题。 
条件增长曲线模型可以被理解为一个调解模型。在这一模 
型中，增长因子被假定为完全调解非时变协变量对结果变量 
的影响，但完全调解不太可能是一个站得住脚的假设。例 
如，在模型6中，如果省略直接连接儿童性别与亲密度的路 
径，那么性别的直接影响就被默认为0。如果这些零限定是 
不适当的，模型拟合度就会变得很差，参数估计值也可能是 
有偏的。一个可行的策略是放宽对直接影响的限定(从而估 
计直接连接协变量与每个重复测度的路径系数)而将^和 
jSz 限定为 0( Stoel，van den Wittenboer Hox ，2004)。 但 
是，这个模型也许并不能从实质上解决问题。 此外 应当记 
住，外生变量影响截距因子的解释是会随着时间的测量尺度 
与时间原点的位置发生变化的 ( Stoel , 2003； Stoel &■ van den 
Wittenboer , 2003) 。 
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第11节 I 模型7:并行过程模型 

；^^¥餘鱗藏.^^鑛纖淫 簿鐵 UBS ? 繳鐵纖 


我们可以研究两个重复测度的变量在变化方面的关系 
对于一个以上变量的增长过程进行拟合，这一过程允许我们 
研究不同变量变化方面的关系 （ McArdle ， 1989)。譬如，研 
究者或许对同时拟合母亲一子女冲突度与父亲一子女冲突 
度的增长感兴趣，并探索一个增长曲线的截距与另一个斜率 
之间的关系。这种模型有“并行过程模型” ( Checmg ， MacKi ¬ 
nnon Khoo , 2003) 、 “多元变化模型 ’’ （MacCallum et al . ， 
1997)、“跨域个体增长模型 ” (Sayer & Willett , 1998； Willett & 
Sayer , 1994, 1995)、“ 多域模型 ” （Byrne & Crombie , 2003)、 
“完全多元潜变量轨迹模型 ” （Curran Hussong , 2003; 
Curran &• Willoughby , 2003) 、“同步增长模型 ” (Curranet al . ， 
1996〉、“二元增长模型 ” （Aber & McArdle , 1991) 或“联合 
LGM M (& C . Duncan &- Duncan , 1994； T . R Duncan , Duncan &• 
Strycker , 2006 ； T . E . Duncan et al . , 1999 ； Tisak &- Meredith , 
1990) 等各种名称,可以很容易从一个简单的随机截距、随机 
斜率模型中得出。并行过程模型包含两组截距与斜率，每个 
重复测度的变量各有一组。截距与斜率间的协方差同样被 
估计(见图 2. 5)。在这个例子中，我们用母亲一子女亲密度 
与母亲一子女冲突度作为两个因变量(见表 2. 9)。样本包栝 
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849个有母亲一子女亲密度与母亲一子女冲突度完整数据的 
儿童 (433 个女孩和416个男孩）。 NNFI 是将一个亲密度和 
冲突度的固定截距模型作为空模型计算的，允许特定时点的 
扰动项共变。 


7:并行过程横型 
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注: CLSN =母亲一子女亲 密度; CNFL =母亲一子女冲突度。 

图 2. S 母亲一子女亲密度与母亲一子女冲突度同时增长模型的路径图 


表 2. 9模型7:并行过程槿型 


参 数 

估计值 

母亲一子女亲密度 


平均截距 A 

38. 00(0.08) 

平均 斜率心 

-0. 36(0. 02) 

截距方差 fU 

2. 99(0. 29) 

斜率 方差仏 2 

0. 14(0. 02) 

截距/斜率协方差 f 21 

0. 25(0.06) 

母亲一子女冲突度 


平均 截距心 

15. 24(0. 20) 

平均 斜率心 

0. 30(0. 04) 
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续表 


参 数 

估计值 

截距方差必33 

25. 74(1.61) 

斜率方差044 

0. 40(0.06) 

截距/斜率协 方差仏 3 

—0. 57(0.23) 

曲线协方差 


截距协方差仏 i 

-3. 88(0. 51) 

CLSN 截距 /CNFL 斜率协方差 f 41 

0.13(0.09) 

CNFL 截距 /CLSN 斜率协 方差& 2 

-0. 41(0.12) 

斜率协方差 f 42 

—0. 07(0. 02) 

曲线相关 


截距协方差 

-0.44 

CLSN 截距 /CNFL 斜率协方差 

0. 12 

CNFL 截距 /CLSN 斜率协方差 

一 0. 22 

斜率协方差 

-0.28 


注 :括号 中的数字是参数估计值的标准误。 

CLSN =母亲一子女亲 密度 ; CNFL =母亲一子女冲 突度。 


表 2. 9显示了一些有意思的结果，但对小学儿童的家长 
来说，也许没有什么是让人惊奇的。首先，如我们所料，与母 
亲一子女亲密度相关的参数估计值与模型4中的几乎相同， 
且任何差异都可以归结于模型7所用样本由于缺失数据的 
缘故而较小这一事实。亲密度与冲突度都随时间而变化，但 
是正如它们的平均斜率估计值所显示的，两者变化的方向相 
反。截距与斜率间协方差的估计值呈现在表 2. 9“曲线协方 
差”部分，这些协方差暗含的相关度则在“曲线相关”的部分。 
截距的协方差(知)是显著的负值，意味着与母亲在一年级时 
特别亲密的儿童经历最少的冲突。同样，斜率协方差(知 ） 也 
是显著的负值，意味着那些亲密度急剧下降的儿童往往就是 
那些随着年龄增长而经历加速冲突的儿童。最后，冲突度的 
截距与亲密度的斜率(如)是负相关的，说明那些在一年级时 
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表现出与母亲相对较多的冲突的儿童，随着他们年纪的增 
长，往往会经历急速的亲密度的下降。 

拓展基本的并行过程模型是可能的。如果与两个变量 
的重复测度相关的斜率被假设成不仅相关，而且有因果关系 
的相关，那么就可以在增长因子间设定有方向性的路径。譬 
如， Curran 、 Stice 与 Chassin (1997) 使用了一个并行过程模 
型，其中青少年酗酒与同辈人酗酒同时随时间发生线性变 
化。年龄、性别和父母酗酒被用来预测变化的方面，而个体 
在每个重复测度的变量截距(调整到最初的测度时点）上的 
差异被用来预测其他重复测度变量的差异性。 Curran 和 
H USSO ng (2002) 对儿童的反社会行为与阅读能力进行并行增 
长建模，预测阅读能力的斜率与反社会行为的截距 。 Curran 
等人 (1996) 设定了一个模型，其中酗酒和光顾酒吧的截距被 
假设影响彼此的斜率。 Raudenbush 、 Brenan 与 Barnett 
(1995) 用同样的方法为同时影响夫妻对婚姻质量评价变化 
的自变量建模，其中每一对夫妻中的每个人都以三年的间隔 
进行测量。此外，也可以设定超过两个重复测度变量的并行 
过程。 
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澹变置增长曲线檐型 


第12节 | 模型8:队列序列设计 


当在一个样本中评估变化轨迹时，横截面研究方法与纵 
向研究方法都有潜在的缺陷。一方面，横截面设计有时会存 
在队列或历史效应，这可能会导致研究者认为存在一个实际 
上并不存在的趋势，或者忽视一个真正存在的趋势。另一方 
面，纵向研究有时会受累于同一个体的重复测度的污染威胁。 
“队列序列设计 ” （Meredith &• Tisak ， 1990； Nesselroade &- 
Baltes , 1979； Schaie ， 1965、 1986; Tisak &- Meredith , 
1990), 也称“加速纵向设计 ”（Miyazaki 8*. Raudenbush ， 
2000; Raudenbush Chan , 1992; Tonry , Ohlin &• Far ¬ 
rington , 1991) 或“收敛方法” （ Bell ， 1953、 1954； McArdle , 
1998)， 通过结合纵向与横截面方法来研究发展变化，这一方 
法一直被建议用来减少这些潜在的混淆。队列序列设计同 
时也大大缩短了进行纵向研究所需的时间，并减少了样本损 
耗的问题 (Tonry et al . ，1991)。考虑一下年龄作为时间度 
量的情况。与其追踪同一批高中一年级新生八年直到大学 
结束，研究者可以选择只追踪三个队列(高中一年级学生、高 
中三年级学生和大学一年级学生）四年。通过运用研究对象 
的多个队列，同时对每个队列只进行几个时点的测量,就可 
以得到整个研究关注的时间段的完全轨迹。队列序列设计 
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应当更多地被视为一种有效的数据收集策略而不是一种建 
模方法，但是这一策略带来了一些有意思的建模选择。 

为了用我们的例子来展示队列序列数据的分析，我们创 
造了两个人为的队列。我们先把数据随机分为两组，然后删 
除部分数据来模仿一个从真正的队列序列设计收集来的数 
据模式。对于队列1，我们删除了所有六年级儿童的测度，而 
对于队列2,我们删除了所有一年级儿童的测度。这就生成 
了一个新的数据集，使得队列1的儿童有一年级、三年级、四 
年级和五年级的数据，而队列2的儿童有三年级至六年级的 
数据。在随机将个案分到每个队列并删除部分数据的过程 
中，我们的样本量减少到了 893 ( n , = 426, « 2 = 467)。当然， 
在实践中，这两个队列的数据会是在同一个5年的时间段内 
同时收集的，甚至在时间尺度上更少的重叠也是可以接 
受的。 

队列序列数据可以用两种方法来研究。首先，研究者可 
以将数据合并，并进行一个单组分析。这一方法将每个队列 
因为没有收集数据而产生的缺失值当做完全随机缺失。这 
一般是一个保险的假设,因为缺失值是因研究设计而产生的 
( T . E . Duncan et al . , 1999； B . Muthen , 2000)。 或者，研究 
者可以把队列看成不同的组而进行一个多群体分析 ( McAr - 
dle Hamagami , 1992)。这个方法与模型5相似，数据按队 
列分组，所有跨队列的相应参数都被限定为相等。这一多群 
体的选择来源于一种处理缺失数据的方法，其中相对较少的 
几个“缺失’，模式是可识别的 （ Allison , 1987； T . E . Duncan et 
al . ， 1999； McArdle &■ Bell , 2000； McArdle &- Hamagami , 
1991； B . Muthen et al . , 1987)。 B . Muth 6 n (2000) 展示了如 
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何用这两种方法来实现队列序列设计。应该注意的是，将不 
同的队列当做单独的群体时，可能会在某些情况下导致估计 
问题 ( T . E . Duncan et al . , 1999)。对于某些样本量小的群 
体，甚至可能会出现比研究者所关心的时点更多的测度时 
点，这使我们不得不删除一些数据，即从模型中去掉一些测 
量时点。在这里，我们的样本量较大，所以这一问题并不重 
要。下面，我们展示单组和多群体两种方法。 

单组方法的设定与模型4是一样的，因此路径图就是图 
2.3 中的模型4。它们唯一的区别就是所有队列1中的研究 
对象都缺失六年级的数据而队列2中的研究对象则都缺失 
—年级的数据。其结果(见表 2.10) 与模型4的结果相似，虽 
然标准差较大，但考虑到较小的样本量和缺失数据,这也是 
预料之中的。尽管这样，结果支持从较大样本分析得来的同 
样结论。一年级平均亲密度分数的估计值 A = 37. 99,而平 
均斜率 &=_(). 35。两者都与模型4中的估计值相似，截距 
与斜率的方差和协方差也是一样的。 


表 2. 10模型8:队列序列设计 


参 数 

单组估计值 

多组估计值 

平均截距 A 

37. 99(0.10) 

37. 95(0.13) 

平均斜率& 

一 0. 35(0. 03) 

-0. 36(0. 04) 

截距方差 fn 

3. 73(0.43) 

3. 73(0.43) 

斜率方差022 

0. 10(0.03) 

0.10(0.03) 

截距/斜率协方差& 

0.21(0. 10) 

0.21(0. 10) 

扰动项方差& 

3. 77(0.12) 

3. 78(0.12) 


注: 括号中的数字是参数估计值的标准误。 


多群体队列序列方法与先前的双组分析(模型 5) 相似， 
所有跨队列的参数，包括截距与斜率的均值，都被限定为相 
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等。谨慎地设定这些相等的限定是非常重要的。在我们的 
分析中，每个数据集只包括那些参与者提供了数据的变量。 
因此，队列1的数据集只有四个对应于一年级、三年级、四年 
级和五年级的测度的变量。同样，队列2的数据集也只包含 
三年级至六年级的测度。队列1的四年级的亲密度变量是 
第三个重复测度，而在队列2中，则是第二个重复测度。两 
个队列的因子负载矩阵 则是： 

「1 On 
1 2 

A! = 


「1 2 -| 

1 3 

A2 _ 

1 4 
_1 5 一 

与之对应的路径图显示在图 2. 6中。 

表 2. 10中右边一栏的参数估计值与那些从单组分析中 
得到的估计值十分相似。关于多群体队列序列方法的另外 
的例子，见 Aber 与 McArdle (1991) ， Anderson (1993) , Baer 
与 Schmitz ( 2000 ) , Buist 、 Dekovi 6 、Meeus 与 van Aken 
(2002) , T . E . Duncan、Dunca 与 Hops (1993) , S . C . Duncan 、 
Duncan 与 Hops (1996) 以及 AcArdle 与 Anderson (1990) 的 
研究。 

请注意，在单组队列序列设计中并没有提供 NNFI ， 这是 
因为部分数据被当做缺失。为了使用最大似然估计以获得 


[ 2 . 12 ] 


[2.13] 




68 


潜变 ft 壜长曲线槿型 



8;队列序列设计 

单组 

f (14) = 73. 16, p<0. 0001 
RMSEA = 0. 07, Cl. 90 : 0. 05, 0. 08 
多群体 

: t 2 (20) = 78. 95, f <0.0001 
RMSEA =0. 08, Cl. go： 0. 06, 0.10 
NNFI = 0. 96 
SRMR= 0. 07( 队列]) 

0. 09( 队列 2) 


注 :CLSN = 母亲一子女亲密度。 


图 2. 6多群体队列序列设计模型的路径图 


以之为基础的所有拟合指标，我们建议在可以获得每一组的 
完全数据的情况下使用多群体的方法，用协方差和平均值作 
为每一队列的输入数据。如果某些个案有缺失数据，我们建 
议采取完全信息最大似然估计法的缺失值估计技术，以利用 
所有可得数据。放弃具有有效信息的数据在绝大多数情况 
下是不恰当的。此外，如果需要在每个队列内分别估计扰动 



第 2 章将潜变最增长曲线模型应用于经验数据 


69 


项方差，选多群体方法会比较好。 

检验队列序列设计的多群体方法可以通过卡方检验以 
明确检验队列效应，如队列平均截距或斜率的差异 ( Ander ¬ 
son , 1993； Meredith &- Tisak , 1"0)。在单组的方法中，也 
可以通过将队列作为截距和斜率的一个虚拟自变量 （ Rau - 
denbush &- Chan , 1992) 并通过其显著性水平来检验队列效 
应，但是这一设定需要有跨队列扰动项方差相等的假设。 [19] 
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第13节 I 模型9:时变协变量 


前面我们把时变协变量定义为通过重复测量获得，并被 
用来预测一个结果变量的重复测度的变量。虽然有很多在 
多层模型的背景下关注 TVC 的文章，但是它们很少关注如 
何在 LGM 的背景下处理 TVC 。 有两种方法可在 LGM 中处 
理 TVC 。 这两种方法讨论了略有不同的问题。第一种由 B . 
Muth 6 n (1993) 提出并在 George (2003), Bijleveld 与 van der 
Kamp ( l " 8 ) 和 Curran 与其同事 (Curran &• Hussong ，2002, 
2003; Curran &- Willoughby , 2003； Curran et al . , 1998； B . 
0. Muthen & Curran , 1997) 的文章中被阐明或被使用的方 
法，即直接将 TVC 当做结果的重复外生自变量包括在模型 
中，如图 2. 7所示。这一模型中的参数被解释为协变量的 
具体时点效应，或是协变量预测结果变量在具体时点上的偏 
差的能力。在这个方法中，一个 TVC 的效应可能会随时间 
而变化，但在个体内部是不变的。或者，;3参数可以被限定为 
相等，来表示协变量的效应在所有时点一直不变的假设。无 
论哪一种情况，这个模型都反映了重复测量变量在控制 TVC 
具体时点效应后的增长。 

我们用图 2. 7中的模型来拟合亲密度数据，把母亲一子 
女冲突度视为与亲密度同时测量的一个 TVC 。 结果呈现在 
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表 2. 11 和图 L 7中 。 NNFI 是通过增强模型 0( 空 模型)来计 


A 


9a: 財变协变量 

3^(24) = 95. 76, p<0. 0001 
RMSEA = 0. 06, Cl. 90 : 0.05, 0. 07 
NNFI = 0. 97 
SRMR = 0. 04 


CLSN 

CLSN 

CLSN 

CLSN 

CLSN 

G1 

G3 

G4 

G5 

G6 




CNFL 

CNFL 

CNFL 

CNFL 

CNFL 

G1 

G3 

G4 

G5 

G6 




注: CLSN =母亲一子女亲 密度; CNFL =母亲一子女冲突度。 


图 2. 7以 B . Muthen ( 1993) 建议的方式 
建立的包含时变协 变曇的 增长曲线模型 


表 2. 11模型 9 a : 时变 协变量 


参 数 

估计值 

平均截距 A 

40 . 17 ( 0 . 41 ) 

平均 斜率心 

-0. 36(0.12) 

截距方差 fu 

2.41(0.25) 

斜率方差^22 

0.13(0. 02) 

截距/斜率协方差^ 

0. 20(0.05) 

扰动项方差見 

3. 52(0.10) 

冲突影响 ( G 1) ^ 

-0. 15(0.03) 

冲突影响 ( G 3 ) 贫 2 

—0. 13(0.01) 

冲突影响 ( G 4) 貧 3 

-0. 13(0.01) 

冲突影响 ( G 5 ) ^ 

-0. 13(0.01) 

冲突影响 ( GS ) 贫 5 

一 0.13(0. 02) 


注: 括号中的数字是参数估计值的标准误。 
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算的，也就是估计 TVC 的五个重复测度的均值和方差。冲 
突度对亲密度的具体时间效应在所有检验的年级保持在 
-0. 15到_0.13之间，表明在每一时点去除个体差异由截 
距与斜率因子解释的部分后，冲突度常常与亲密度负相关。 
在没有满足建立因果关系的标准之前，将这一关系称为因果 
关系是没有依据的。 

另一个将 TVC 纳人增长曲线模型的方法利用了定义变 
量。这个方法同 SEM 的标准做法有些不同，但与多层模型包 
含 TVC 的标准方法 (Raudenbush Chan , 1993) 类似。时间 
(或年龄等)变量本身可以被看做一个 TVC , 因为时间在结果 
的重复测度上是不同的。如果定义变量能够容纳不同个体的 
不同测度时点，那么它们也能够以相似的方式被用来对其他 
TVC 的效应建模。一个额外的斜率因子被添加到模型中来表 
示 TVC 。 TVC 的值被加入到个体数据矢量中，实质上给每个 
个体或第二层单位一个独特的烏矩阵。在这一方法中，一个 
TVC 的效应可以在个体间变化，但不随时间而变化。也就是 
说，被估计的是一个不同个体间的平均 TVC 效应，如果需要的 
话， TVC 的斜率因子的方差(以及同其他变化因子之间的斜方 
差)也可以被估计^这一方法要求将原始数据作为输人数据。 

例如，来看图 2. 8中的模型。在每个测度时点（年级）， 
每个个体也提供了母亲一子女冲突度 ( TVC ) 的数据。三个 
个体数据矢量被作为例子，菱形框中的数字表示每个 TVC 
的个体数据矢量的内容。同样的标记法在 Mehta 与 West 
(2000：34)的著作中可以找到。使用这一方法，多个 TVC 可 
以通过对每个协变量使用一个不同的斜率因子负载来纳人 
模型。 TVC 间的交互(如年级与母亲一子女冲突度之间的交 
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互)可以通过将协变量的斜率负荷乘积作为斜率因子来研 
究。譬如，在图 2. 8中，个体1的交互因子的负载就是0、20、 
21、72和80。非时变协变量与时变协变量间的跨层交互可 
以通过纳入 TVC 的斜率因子的预测值来设定。用这种方式 
设定的模型相当于带有第一层自变量的多层模型。 


A 



|CLSN Gl| |CLSNG3| |CLSN G4| | CLSN G51 | CLSN G61 

<^> <S> <S> €> 

|CLSNGl| |CLSN G3] |CLSNG4| | CLSN G51 | CLSN G61 

舍 <^> <§> Tvgll 

|CLSNGl[ I CLSN G31 [CLSNG4| | CLSN G51 |CLSNG6| 


注:增长模型可以用于重复测量的协变量。扰动项方差被列出但没有解释。 
CLSN =母亲一子女亲密度; TVC =时变协变量。 

图 2. 8以 Mehta 和 West {2000) 建议的时间处理 
方式建立的包含时变协变量的增长曲线模型 


表 2. 12模型 9 b : 时变协变置 


参 数 

估计值 

95%置信区间 

平均截距仏 

40. 12 

{39. 82, 40. 43} 

平均年级斜率心 

一 0. 31 

{ — 0. 35， 一0. 27} 

平均冲突斜率心 

-0. 14 

{ — 0. 16， 一0. 12} 

截距方差 

4. 93 

{3.40, 6. 72} 

年级斜率方差 

0. 11 

{0.08, 0. 15} 

冲突斜率方差&3 

0.02 

{0.02, 0.03} 

截距_/年级斜率协方差仏 i 

0. 11 

{-0.08, 0.29} 

截距/冲突斜率协方差 

一 0.28 

{ — 0. 39， 一0.19} 

年级/冲突斜率协方差^32 

0. 00 

{—0.01， 0.01} 

扰动项方差艮 

3.28 

{3. 09, 3.48} 
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用图 2. 8中的模型拟合亲密度和冲突度数据，进而得到 
表 2. 12中的结果。因为是以原始数据作为输人数据，并未 
提供拟合指标(如 RMSEA 和 NNFI ) 。由于我们是用 Mx 来 
做这个分析，所以我们能够提供以似然值为基础的95%置信 
区间而不是常用的标准误 ( Mx 并不提供标准误作为默认的 
选项，实际上，它警告不要对具有非正态样本分布的参数，如 
方差，使用标准误)。 [2()] 所有的参数估计值——除了两个之 
外——都是统计显著的。 
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第14节 | 模型10:多项式増长曲线 


到此为止，我们用增长曲线模型研究的轨迹都是时间或 
年龄的简单线性函数，但 LGM 的使用者并不必局限于线性 
函数。迄今所提出的模型框架可以容纳任何在参数上是线 
性而在变量上是非线性的轨迹。也就是说，基本的 LGM 模 
型可以包容任何增长的参数来拟合与转化后的时间测量尺 
度相关的简单线性加权的轨迹。一个常见的例子是图 2. 9 
中的二次潜变量增长曲线 （MacCallum et al . ，1997； Mere ¬ 
dith &■ Tisak 1990； Stoolmiller , 1995)。 在图 2. 9 中，与二次 
斜率因子相关的负载是与线性斜率因子相关的负载的平方。 
二次斜率的均值 ( a 3 ) 表示了轨迹中二次曲线的弯曲程度。 

我们用图 2. 9中的二次增长曲线来拟合亲密度数据。 
结果呈现在表 2. 13和图 2. 9中。二次分子的均值并不显著 
(«3 =—0. 019, p = Q . 077)。卡方差异检验显示，与单纯的线 


性模型相比，模型拟合度的提高是微不足道的，即 AX 2 (1) = 


3.12, p = 0 . 078。如果有理论上的动机，我们可以选择允许 
二次斜率因子随机变化并与截距和线性斜率因子共变 ( Wil ¬ 
lett & Sayer , 1994) ，尽管并不存在一个固定而显著的平均 



善，但是很可能是因为额外增加的三个自由参数吸收了部分 
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随机的差异，从而过度拟合了数据。 


10:二次增长曲线 

3^(13) = 72. 78, p< 0.0001 



图 2. 9 —个包含固定二次斜率因子的潜变量增长曲线模型 


表 2. U 模型10:多项式增长曲线 


参 数 

估计值 

平均 截距仏 

37. 94(0.09) 

平均线性斜率 A 

-0.26(0. 06) 

平均二次斜率 A 

-0. 02(0.01) 

截距方差 fu 

2. 98(0. 29) 

二次斜率 方差& 2 

0. 14(0.02) 

截距/线性协方差 & i 

0. 25(0. 06) 

扰动项方差先 

3. 70(0. 10) 


注:括号中的数字是参数估计值的标准误。 


我们并不认为在通常的情况下，当一个线性 LGM 不能 
充分拟合数据时，二次增长曲线就更有可能实现拟合。我们 
奉劝研究者不要使用以二次模型来描述某个特定的研究样 
本可能导致的独特性这种研究策略。我们怀疑，在社会科学 
中没有几个理论会自然地导致预测一个特定二次趋势的非 
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线性变化。假定有足够的重复测度使额外的方差与协方差 
参数可以被识别，那么任意数量的多项增长因子都可以被加 
人到模型中。但是，这些做法必须基于一个适当的理论 
基础。 

另外，我们也可以设定除了多项式曲线之外的函数形 
式。稍后我们会讨论结构潜变量曲线。这是对传统的增长 
曲线模型的拓展，它可以容纳更为复杂的、在参数上呈非线 
性的函数形式，其中增长的参数不再必须是简单的线性加 
权。例如，在对人口增长建模中常用的指数函数。 
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第15节 | 模型11:未设定轨迹 


到目前为止，在我们所描述的模型中，把结果变量和时 
间连接起来的函数是完全被定义的。例如，在图 2. 3中，从 
斜率因子到测量变量的路径在线性回归中被固定为从0到5 
的数值，对应于年级对母亲一子女亲密度的线性影响。关于 
LGM 的一个创造性的拓展涉及形态因子的建 立:变 化方面 
的增长函数的形态(及其因子负载)不是由研究者先验设定 
的，而是未知的且必须从数据中估计得来的 （Meredith & 
Tisak , 1990)。例如，在模型4中，我们可以用形态因子替代 
线性因子，把这一新因子的第一个和最后一个负载分别限定 
为0和1[ 21 ]，然后以0和1为基点，估计其他的三个负载 
a 22 、 A 32 和; 1«)。被估计的负载将显示纵向数据的形态。虽 
然自由负载本身并不成比例，但是大致线性增长会导致负 
载从0到1单调递增。还可以将前两个负载限定为0和1， 
在这种情况下，以发生在第一次和第二次之间的变化作为 
基准来解释接下来的间隔 （Hancock & Lawrence , 2006; 
Stoel , 2003)。含有形态因子的模型有时候被称做“完全潜 
模型 ” （Curran & Hussong , 2002, 2003; McArdle , 1989)、 
“充分潜模型 ” (Aber McArdle , 1991) 或者“未指定模型” 
( T . E . Duncan et al . , 2006 ； Lawrence &- Hancock , 1998 ； 
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Stoolmiller , 1995； J . Wang , 2004) ，因为轨迹没有被先验地 
设定。这种模型比前面讨论的模型具有更多的探索性意 
味，因为研究者不是在检验关于特定轨迹的假设。相反，数 
据被用来理解何种轨迹是适当的。解放某些线性斜率因子 
的负载来建立一个形态因子，允许通过嵌套模型卡方差检 
验——本质上是一个偏离线性的检验——对两个嵌套模型 
进行直接的比较。 Duncan 等人 ( T . E . Duncan et al . , 1993) , 
T . E . Duncan 、 Tildesley、Duncan 与 Hops (1995) 以及 McAr - 
dle 和 Anderson ( 1990) 提供了有关未设定轨迹模型的较好 
的例子。 

我们把未设定轨迹模型用于拟合母亲一子女亲密度数 
据，将第一个和第五个负载分别固定为0和5,使之与先前的 
时间标度一致(见图 2. 10)。比较模型11与模型4的卡方差 


11:未设定轨迹 

X 2 (11) = 73. 22, p<0. 0001 



CLSN 

CLSN 

CLSN 

CLSN 

CLSN 

G1 

G3 

G4 

G5 

G6 



ft e, e, e, e. 


注 : CLSN = 母亲一子女亲密度 „ 


图 2.10 —个表示含有未设定形态因子的潜变置增长曲线的路径图 



触置 增长曲线模型 


—年级起的年份 

图 2. 11从一年级起的斜率因子负载与年级的折线图 

异检验的结果是，它们没有显著的差异，即 a /(3) =2.68, 
P = 0 . 44 0 这表明一个线性的趋势足以对母亲一子女亲密度 
数据建模，因为斜率负载在没有限定的情况下仍然遵循一个 
近乎线性的趋势，如图 2. 11所示。 
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第16节 | 总结 


在这一章中，我们描述了几个潜变量增长曲线模型。从 
一个基本的空模型开始，每个模型都被依次运用到同一个数 
据集来说明模型是如何实践运用的。除了带有随机截距和 
随机斜率的基本线性 LGM 外，我们展示了模型如何被拓展 
来处理多群体、纳入解释截距与斜率因子的自变量以及多于 
一个结果变量或一个年龄队列的增长的情况。我们还展示 
了如何将 TVC 添加到一个增长曲线模型中以及如何为多项 
式或未设定的非线性轨迹建模。 

我们要强调的是，研究者不需要被强迫来逐个研究这一 
章所描述的模型。如果理论或以前的研究表明一个随机截 
距、随机斜率的模型是恰当的，那么就没有必要拟合一个更为 
简单的模型。同样，如果有理由期待一个第二层自变量能解 
释个体在一个多项式趋势的二次因子上的差异，那么将模型6 
与模型10结合就是理所应当且恰当的，而不是以其中的一个 
或另一个作为开始。简言之，重要的是我们总要首先依赖于 
理论。如果理论不够明确，无法建议应该研究的模型，那么本 
章所展示的探索性策略——从一个空模型出发，逐步包含线 
性斜率因子，并添加随机效应与自变量——对于帮助研究者 
理解数据并恰当地对随时间而变化的变量建模是有用的。 
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瓚变置增长曲线模型 


讨论至此，我们并没有穷尽潜变量增长模型的所有可能 
性。随着科学检验的日益复杂，过去检验这些假设的模型也 
因此在复杂性和灵活性上有所增加。在本章中，我们会利用 
最近一些统计理论的发展和软件技术的提高，呈现几种有趣 
且比较有用品拓展和一些传统增长曲线模型的特殊应用。 
这些应用包括增长混合模型、分段增长曲线模型、潜变量变 
化模型、结构潜变量曲线模型、自回归潜轨迹模型和对分类 
变量变化的建模。 
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第1节 I 増长混合模型 


在前面讨论的大部分模型中，我们假定单个的潜变量轨 
迹会充分反映总体中的变化模式，同时又允许曲线有随机误 
差。在模型5中，我们注意到离散型变量（例如，男性和女 
性)可以有不同的变化曲线。也就是说，不同的增长曲线能 
够在几个已知的组群中被同时估计，并且关键参数的估计有 
无跨组的限制皆可。然而，分类变量并不一定要直接测量， 
潜在的(不可观测的)类型也有可能产生异质曲线。如果存 
在一个以上这样的曲线，而仅仅设定一个轨迹，那么就有可 
能产生显著的偏差，并得出错误地代表所有轨迹类型的轨迹 
( Sterba , Prinstein &- Cox , 2007; Von Eye &- Bergman , 
2003)。 

如果可以合理地假定异质曲线有潜在的来源，研究者就 
可以应用潜变量增长混合模型 ( LGMM )。 在一个潜变量增 
长曲线混合模型中，假定总体包含 K 个同质小组的混合，每 
个小组有它自身的变化轨迹。有两种通用的方法来拟合增 
长曲线混合模型 （ B . Muthen , 2001; Nagin , 1999； Nagin &• 
Tremblay , 2001) ，这两种方法都包括在一个潜在的分类变量 
上计算的回归潜截距和斜率,并且都允许轨迹的形式在不同 
类型中不同(例如，轨迹在一个类型里可以是线性变化，在另 
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一个类型里可以是二次方程变化）。两种方法之间的主要不 
同之处在于， Muthen(2001) 的方法允许轨迹在同一个等级内 
有变化，而 Nagm(1999) 的方法要求轨迹在不同等级之间变 
化。因此，较之前者， Nagin(1999) 的方法通常会得出更多的 
潜在类型存在的结论。 

LGMM 的一个潜在的缺点是，这一模型可能致使研究 
者相信多个同质小组的存在，而实际上仅仅存在一个这样的 
小组，只是其数据分布是非正态分布或服从一个非线‘性的趋 
势 (Bauer & Curran, 2003a)。 换句话说，增长混合模型识别 
的组也许不代表真正的组，而是一个混合轨迹分布的组成部 
分，将这些组成部分放在一起，大致像一个单个的非正态分 
布。因为异质次总体的存在是潜在增长混合模型的一个基 
本假定，而这个方法不能证明有 K 个类别的存在，就像传统 
的潜变量增长曲线模型并未证明仅隐含一个总体曲线一样 
(Bauer & Curran, 2003a, 2003b, 2004)„ —■般来说，有大量 
的证据可以证明 LGMM 的很多假定被违反,并产生了不正 
确的潜在类型 (Bauer， 2005, 2007)。 

增长混合模型不太容易被理解和操作。 LGMM 经常会 
产生错误的结果或者扩大分类,其时间起始值也经常会影响 
参数估计。除此之外，模型评估和模型选择也不是很直接。 
虽然设定不同分类数目的模型可以用贝叶斯信息准则来比 
较，但是这些标准在混合模型中的应用仍然有很多争议。在 
各个阶段，都需要作出几个比较主观的判断。再次，混合模 
型比起标准的模型常常需要更大的样本量。最后，虽然在潜 
变量分析中违反假定条件总是一个潜在的危险，但是潜变量 
增长混合模型是最容易受影响的。违反分布假设和错误设 
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定曲线的形式可能导致把同质总体分成多重类别。即使缺 
点重重，但这些方法仍然可能实现令人满意的应用。例如， 
增长混合曲线模型可以检验包含等效原则的发展理论，即不 
同的起始条件会产生相同的结果，以及多瓣发展理论，即相 
同的起始条件会产生不同的结果 （Cicchetti & Rogosch, 
1996)。 

混合增长曲线模型是一个正在被积极研究的领域，不断 
有新的研究成果出现。例如， Klein 和 Muth6n(2006) 描述了 
一个混合增长曲线模型的拓展,允许增长的异质性依赖于初 
始状态和非时变协变量。较之标准的增长曲线模型，这种方 
法会产生更准确的间隔预测，但是这种方法在大部分软件中 
还没有实现。 

目前，增长混合模型能够通过 MEC0SA 中的高斯程序 
(Arminger, Wittenberg &- Schepers, 1996)、 MplusCL. K. 
Muthen &- Muthen, 1998 — 2006)、Mx(Meale et al. ， 2003) 
以及 SAS PROC TRAG(Jones, Nagin & Roeder, 2001) 实 
现。目前, Mplus 是这些软件中最灵活的。有兴趣的研究者 
可以参考 Bauer (2005，2007)， Bauer 与 Curran (2003a, 
2003b，2004)，T. E. Duncan 等人 （2006) ， Li，Duncan、Dun- 
can 和 Acock(2001) 以及 ML Wang 与 Bodner(2007) 的著作。 
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第2节 I 分阶段増长 


假设以前的理论或者研究显示，增长应该是以不同的速 
度进行的，但仍然是线性的。例如，相比小学阶段而言，在中 
学阶段可能不同（也许是因为不同学校的资金来源不同）。 
两个增长阶段可以在单一的增长曲线模型中用分阶段增长 
模型 （ T . E . Duncan et al . , 2006； Sayer &- Willett , 1998) 或 
者间断点设计 （Hancock & Lawrence , 2006) 来建模。通过 
在一个模型中纳人两个或者更多的线性斜率因子，可以设定 
分阶段增长模型。例如，如果我们连续在七年级至九年级收 
集数据，并假设在中学时增长速度会下降，那么负载矩阵皂 
看上去会像方程 3.1: 
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在方程 3. 1中，第一列代表截距，第二列代表直到六年 
级为止的线性增长(第五次测量），第一个线性斜率因子的平 
均值代表线性增长的速度，这个速度是描述小学增长阶段 
的。矩阵的第三列代表中学阶段的线性增长，把小学阶 
段的最后一年看做第二个阶段的起始点。第二个阶段斜率 
的平均值看做第二个阶段的增长速度。另外一种设定(但在 
统计上是相当的)可以用方程 3. 2 中的皂 矩阵 （Hancock & 
Lawrence , 2006) „在方程 3. 2中，第一个斜率因子代表从一 
年级到九年级的线性增长，第二个斜率因子代表任何其他的 
线性变化，七年级之后的变化可被这一线性斜率捕获。 



最近，一些方法研究的成果展现了一些激动人心的可能 
性，那就是对发生在离散时段的变化建立模型。 Cudeck 和 
Klebe (2002) 展示了长期纵向数据的多阶段建模，每个阶段 
可以有不同的函数形式(例如，一个下降的斜率会紧跟一个 
向上的斜率)。从一个阶段到下一个阶段的转折点被叫做 
“变化点”或者“结”。从理论上来说，在建模时，这些变化点 
有自身变化的方面——比如通过固定参数，待估参数或者随 
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机系数来设定。例如，在人的一生中，非语言智力的发展变 
化中， Cudeck 和 Klebe 对此建立急速的二次增长，并逐渐变 
成线性 下降。 他们将年龄从第一阶段到第二阶段转变的评 
估作为一个随机系数，以 18. 5为平均数，第二层的方差是 
9.25。 


-1 

1 

1 
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0 1 
0 1 


0 ' 
0 
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1 3 
1 4 
1 5 


[3.3] 


[3. 4] 


不是任何时候都能够在增长曲线模型框架中设置多阶 
段模型，但是如何检查模型拟合度、用变化特征作为预测变 
量、评价潜变量中心多阶段变化都值得进一步探讨。如果已 
知变化点，可以用分割矩阵 A , 来检测多阶段模型，每个分区 
的基础包含曲线轨迹的相应部分。例如，在方程 3.3 中， 
矩阵代表在等距间隔的情况下，在第一阶段有一个截距和线 
性斜率(均值分别为 m 和的），而在第二阶段有一个不同的截 
距和线性斜率(均值分别为 a 3 和 a 4 ) ，两个阶段之间有一个变 



第 3 章模型的特别拓展 


化点，时间等于 2. 3。另外,如果按照方程 3. 4那样设定~ 
矩阵，一个未知的变化点 W 也可以被估计，并将它作为模型 
参数的一个函数。在这个模型中，时间测量尺度从第二列中 
脱离，但是会在第四列重新进入模型。假定分段 U + 
a t time ) 和 ( or 3 + a 4 time .) 在时点 ime = 时是连续的，那么: y 
值所表示的数值在多阶段曲线的两个阶段必须在 a > 时相等。 
因此其中一个参数(例如， &) 是多余的，可以通过限制其等 
于其他参数的函数来取消对其的估计，即设定 a 3 = a ,+( a z - 
a 4 ) c , 而将 a ) 作为一个参数估计。对于更复杂的多阶段模型 
和更复杂的多阶段增长函数，相应的数学模型可以被应用到 
增长模型中。目前没有简单的办法对随机系数变化建模，但 
是此问题可以在多层模型中解决 ( Cudeck 匕 Klebe , 2002)。 
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第3节 | 多指标潜变量的变化模型 


前面提到的模型都没有充分利用结构方程模型最基础 
且最有用的 特征: 对多重测量指标的潜变量之间的关系进行 
建模的能力。我们尚未讨论过任何可靠性和测量误差的问 
题，但是实际上在社会科学中，几乎不可能有接近完美的可 
靠性。通常结构方程模型可以把可测量的方差分为共同方 
差(一组可测量的变量的共同方差)和特别方差(特定的变量 
有特定的测量误差和方差可靠性)来为不可靠性建模。在大 
多数结构方程模型的应用中，找对角线的部分代表特别方 
差，但在潜变量增长模型中，玖对角线代表测量误差和偏离 
均值程度的总和。为了把共同方差和特别方差区别开来，重 
复测量可以用潜变量来代表而多重时点标识变量可以直接 
引人模型中。这些模型有时候被叫做“曲线因素模型” 
( S . C . Duncan & Duncan , 1996 ； McArdle ， 1988)、“潜变量纵 
向曲线模型 ” (Tisak & Meredith , 1"0)或者“二阶潜变量增 
长曲线” （ Hancock，Kuo Lawrence , 2001 ； Hancock &• 
Lawrence , 2006; Sayer & Cumsille ，2001) 0 重复测量的潜 
变量被称为“一阶因子”，而增长因子(如截距和斜率)被称为 
“二阶因子”。请参看图 3.1 中的一个例子。 
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A 



注 :模型 中还应有从三角常数1到不用标刻度指标的测量指标的那些路径 
( r .v 参数），但图中并未展现 （Hancock et al. ， 2001 )。 由于并不指望在不同 
时点测量的指标之间的协方差可以完全用它们对增长因子的共同依赖来解 
释，我们允许相似指标的独特因子在各个重复测量之间具有共变性。 

图 3.1 有三个测量指标的潜变置的四个 
重复测度的线性变化的二阶增长曲线模型 

当有多指标量时，用潜变量重复测量模型有几个优 
点。第一，二阶潜变量增长曲线模型能够在重复测量中清楚 
地辨认测量误差的出现，并利用潜变量建模，调整误差的出 
现。第二，二阶增长曲线模型允许区分由于偏离均值而导致 
的干扰项差异(临时不稳定性，在图 3 . 1中由如至知反映） 
和由测量误差导致的特别差异(不稳定性，在图 3. 1中由找 
反映)。第三，二阶增长曲线模型可以检测纵向因子的不变 
性或者静止性 (Sayer & Cumsille ， 2001; Tisak &- Meredith , 
1990)。 对于关注的潜变量，保证其在整个测量周期中含义 
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不变是非常重要的 ( Willett , 1989)。要想让这个假设成立， 
在整个重复测量的过程中，因子结构是不应该变化的 ( Chan ， 
1989； Meredith &- Horn , 2001)。也就是说，至少对于相似 
的项目，因子负载在重复测量上应当是一样的。虽然探究纵 
向因子不变之类的问题超出了本书的范畴，但无论如何强调 
这类问题对理解增长随时间变化的重要性都不为过。关于 
设定二阶增长曲线的更多细节，请参考 Han (1998)、 Han ¬ 
cock 等人 (2001) 以及 Sayer 与 Cumsille (2001) 的著作。 
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第4节 I 结构潜变 ft 曲线 


早期的多项增长函数具有一个特点，那就是“动态一致 
性”。大致说来，动态一致性指的是“曲线平均”的特质，它与 
“平均曲线”有同样的函数形式 (Singer &• Willett , 2003)。这 
个特征适合线性增长、二次增长模型和任何包含加权并随时 
间变化的线性变化的增长函数。至于增长参数(如果以传统 
的多项式形式表达），严格意义上动态一致性的结果应该是 
增长函数的一阶导数为简单的数字，这些数字能够直接在 A , 
矩阵中编码，并在实际的结构方程模型的软件中应用。但如 
Merdith 和 Tisak (1990) 所建议的，潜变量增长曲线模型的增 
长函数不一定被限定为多项式曲线。 

Browne 与 du Toit (1991) 以及 Browne (1993) 著作中曾 
提出并说明了结构潜变量曲线的方法以建构没有动态一致 
性的非线性增长函数模型。在结构潜变量曲线中, A , 的负 
载可以与任何假定的增长函数 /(«, (9)( 时间^增长参数为夕 
的函数)在数值上保持一致，这一函数被称为“目标函数” 
( Blozis , 2004)。函数 /( f ， 扪被认为是平滑的，并随着0的不 
同而不同。结构潜变量曲线方法设定的增长模型是 Rao 
(1 9 58)的 EFA(Exploratory Factor Analysis ) 方法所获得的 
增长函数参数的一种直接的拓展。 矩阵皂 的元素不是设定 
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的固定值，它们是被估计的，但要求与基础的曲线函数 / U，W 
保持一致。前面例子中提到的多项式曲线模型是这个更普遍 
的框架中的特殊例子。 

为了更好地理解结构潜变量曲线，对于每一个增长参 
数，其在矩阵 A , 中为多项增长曲线模型设定的负载对应于 
假定的增长函数的一阶偏导数。例如，在模型10中设定的 




9i = d\ + 体 4 +9 3 t [ , t = {0, 2, 3, 4, 5} [3. 5] 


对于每一个增长参数，这个函数的一阶导数各自是: 


3 9i 


ddi 


3 y , 

= 1 


和 


3 % 

W , 




这些是已知量。因此， 


A , 


rl 0 
1 2 
1 3 


1 4 16 
1 5 25 


[3. 6] 
[3. 7] 


[3.8] 


[3.9] 


更复杂的但动态不一致的增长函数（例如，指数增长、 
Gompertz 函数和 logistic 曲线)可以用类似的方法设定。对于 
动态不一致的增长函数，增长参数0不能被简化成？的简单 
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函数，它可能需要更复杂的皂设定。例如，对于指数增长模 
型，如果一个指数变化适于拟合父母与子女关系的变化(事 
实上并不是，我们只是假定），目标函数将 会是： 

% = Oi~ (ft —0 2 )e a_< *4 , f = {1, 3, 4, 5, 6} 

[3.10] 

对于每一个参数，这个函数的一阶导数各自是： 



— 

39, 

: 1 — 

e m-o 

[3. 11] 


利2 


[3. 12] 

和 





It = 沾 一 


[3. 13] 

因此，如果我们让最初的值^=1， 则有： 
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[3. 14] 
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对于多项式曲线模型，的、 ft 和 ft 是三个基础曲线因子 
的均值估计。但在指数的结构潜变量曲线中名和 ft 是估计 
均值，而 ft 是用 LISREL 的附加参数特性来估计的。这类模 
型的详细讨论在 Browne (1993) 和 Blozis (2004) 的著作中有 
所描述。 Blozis 在其2006年的研究中 ( Blozis ，2006) 拓展了 
这种方法来为多指数测量的潜变量建构非线性模型，并在 
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2007年的研究中将该方法延伸至探索多变量非线性变化 
( Blozis , 2007)。我们需要专门的软件 (du Toit Browne , 
1992) 来估计大多数结构潜变量曲线，但是 LISREL 通过复 
杂的等式限定是可以用来估计这样的模型的。 
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第5节 | 自回归潜变量曲线模型 


虽然在研究随时间变化而发生的变化时，潜变量增长曲 
线模型是一个有用且灵活的方法，但是还存在其他以结构方 
程模型为基础的方法。其中一个方法是 Guttman 提出的自 
回归或者马尔科夫单一模型 ( Guttman ， 1954)，其中每一个 
重复的测量被看做是一个以前的测量和在某一具体时点上 
的干扰项的函数。与传统的潜变量增长曲线模型不同，这种 
单一模型不考虑随时间变化的均值结构，但是会用以前时段 
收集的测量数据来解释方差的变化。 Curran 与 Bollen 
(2001) 以及 Bollen 与 Curran 的著作 (2004, 2006) 提出自回 
归潜变量轨迹模型 ( ALT ), 这种模型既包含潜变量增长模 
型，也包括单一模型。一个自回归潜变量轨迹模型的例子在 
图 3. 2中有所描述„ ALT 模型主要在两个方面不同于标准 
的潜变量增长曲线模型 :第一 ，在图中所描述的 ALT 模型参 
数化过程中，没有与第一个重复测量相关联的干 扰项; 第二， 
像自回归和单一模型一样，直接路径（图 3. 2中的 p 参数)被 
设定以连接相邻的重复测量。通常情况下，单一模型和 ALT 
模型会限定化^参数相等，虽然这样的限定并不是必需的。 
ALT 模型和之前提过的一个 TVC 模型有关联(模型9,见 
表 2. 8) ，其中在时点 r 一 1的结果变量被用来当做 f 时点的一 
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这2 氏3 贫4 贫5 

图 3.2 有五个重复测度的自回归潜变置曲线模型 


个自变量。单个变量或多元变量在 ALT 模型中的应用可以 
在 Rodebaugh、Carran 与 Chambless (2002) 以及 Hussong 、 
Hicks 、 Levy 和 Curran (2001) 的著作中找到。一个与之更相 
关的模型是潜变量差异分数模型 ( McArdle ， 2001； McArdle ^ 
Hamagami , 2001) 0 
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第6节 I 分类变量和次序变置模型 


至此，我们所讨论都是基于重复测量的变量是定距或定 
比性质的假设。然而，在社会科学中，许多变量常常是定序 
变量。例如，二分变量或者只有三个或四个选择的 Likert 量 
表就很难被假定具有定距或定比变量的特征(虽然在有很多 
选择的时候，它们可能被看做是连续的）。当重复测量的变 
量是定序变量时，这个数据包含的就不是均值或者协方差， 
而是一个潜在的大型列联表，在此之中，每一个单元格包含 
的是应答者所对应的一个特别的应答模式。如果这个定序 
数据能够被认为反映了一个潜在的正态分布变量，一个多阶 
段的估计过程就可以用来对增长建模 （ Mehta，Neale & 
Flay , 2004)。这个过程假设在每一次测量时，潜变量分布中 
观测不到的阈值会决定与应答模式关联的多元概率。在第 
一阶段，设定一个关联函数来对多元定序应答概率建模并估 
计每一个个案的似然性。在第二阶段,为不能观测的、假定 
为正态分布的潜在应答变量建立一个共同的测量尺度。应 
答的阈值被假定不随时间变化而变化。在第三阶段，一个增 
长模型被拟合到具有尺度的潜在应答变量上。目前,仅有几 
个软件能够估计此类模型，如 Mplus 与 Mx 。 如果有缺失数 
值， Mx 是唯一的选择。 j 6 re S k O g ( 2 00 2 ) 用 LISREL 描述了一 
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个类似的程序，涉及从拟合模型中得到一个多分格协方差矩 
阵以及从原始的定序数据中估计得到均值。 

在方法论文献中，对于分类变量进行潜变量增长曲线建 
模的应用正受到越来越多的关注。例如， Liu 与 Powers 
(2007) 最近描述了一种在潜变量增长曲线模型框架中对零 
膨胀计数数据建模的方法。在可预期的将来，会有更多有意 
思的进展。要了解更多的对二分变量和定序变量建立模型 
的方法，参见 JoreskogC 2002), Mehta 等人 （ 2004 ) 以及 R 
Muth 6 n 与 Asparouhov (2002) 的著作。 
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第7节 | 在变化中对因果关系建模 


讨论至此，截距和斜率的(协)方差都是“无结构的”，即 
允许它们自由共变。我们也可以相应地选择估计变化方面 
的直接影响，也就是说,我们可以对变化建模，把它看做另外 
一些变化的函数。例如，时间尺度集中在测量的最后一次， 
如果我们能对“结束点”建模，把它作为变化的函数，我们就 
可以对截距和斜率进行回归。另外，我们也可以在起始点集 
中，把斜率作为截距的线性函数来建模。当然，我们要特别 
谨慎，原因应该在逻辑上早于结果，否则用截距对斜率回归 
就会在原因和结果上不匹配，除非原始时点发生在第一次测 
量以前。 

在一些情况下，研究者会将参与者随机地安排到至少两 
个组中，并对一些他们感兴趣的结果进行多次重复测量，例 
如干预性研究。 Muth 6 n 与 Curran (1997) 创造性地利用了 
SEM 的这个特征对实验效应进行建模。他们建议在两个小 
组中拟合同样的曲线，限定各组中的线性增长参数相等(见 
图 3. 3)。第二个斜率因子 ( Tx 斜率)为实验组所特有而被加 
人到模型中。控制组提供了一个基线轨迹，因此实验组的轨 
迹能够与之比较。任何和第一个斜率相关的、被观测到的额 
外变化都可以被看成实验的影响。模型的一个重要的方面 
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是额外的实验斜率因子可以对截距因子(初始状态)进行回 
归分析，并允许检测截距和实验的交互影响。例如，在干预 
性研究预防外部行为的时候，如果母亲一子女亲密度的值在 
起始状态较低，可能会在之后的干预中得到更大的益处。在 
Muthfe 与 Curran 的模型中，截距因子会影响第三个潜变量 
(干预)，而后者又会影响随时间变化的测量变量，但此影响 
仅仅发生在实验组中。 
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第8节 | 总结 


在这一章中,我们描述了几个潜变量增长模型的特别拓 
展，说明潜变量增长模型作为一个分析工具是具有一般性和 
普遍性的。 

根据研究者的要求，结合这里讨论的模型的特征，用其 
他方法扩展这些模型也是可能的。例如，将增长混合模型应 
用到队列序列数据中，并检测 TVC 的影响，或者将 TVC 看 
成并行过程 ALT 模型外部预测变量也是可行的 （Bollen &■ 
Curran , 2004; Curran &- Willoughby , 2003)。 Simons - Mor - 
ton 、 Chen 、 Abroms 和 Haynie (2004) 对三个并行过程（青少 
年吸烟、朋友吸烟和父母介人)建模，包括非时变的预测变量 
并设定截距对斜率在过程之内和过程之间的效应。 Sayer 和 
Will ett (1998) 结合分阶段和并行过程增长模型，对两个组同 
时进行拟合。 McArdl e (1989) 描述了一个多组并行过程模 
型。最后，虽然我们没有对以上这些模型进行说明，但是把 
截距和斜率看成结果变量的预测变量是十分简单的。例如， 
检验某种技能是否能预测个人在多年后能力的差异这一假 
设可能是重要的。 Muth 6 n 与 Curran (1997) 描述了一些模 
型，其中截距和斜率因子被用来预测一个远端结果或者与截 
距和斜率因子相关的重复测量变量。 
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潜变量增长曲线模型框架允许设置和检验几个不同种 
类的交互和调解的假设。例如，研究者能够对两个或者多个 
外生自变量的斜率 （Curran et al . ，2004； Li Duncan 
Acock , 2000； Preacheret et al . ， 2006) 在初始状态和决定结 
果的时段 (Mutton 8^ Curran ， 1997)，或者在时段和 TVC 之 
间(见第2章模型9的讨论）的交互进行假设检验。通过应 
用多层结构方程模型，潜变量增长模型也可以被扩展到三层 
次(或者多层次）的多层数据分析中 （Mehta & Neale , 2005； 
B . Muthen , 1997)。 另一方面，作为潜变量增长模型中的特 
殊例子，拟合简单的 ANOVA 、 MANOVA 和单一模型也是 
可行的 （Meredith Tisak ， 1990)。 
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纵向数据建模的潜变量增长曲线模型的一个有效的替 
代方法是多层模型 （ MLM; Bryk &• Raudenbush, 1987, 
1992 ； Goldstein ， 1995; Hox, 2002 ； Kreft &- de Leeuw, 
1998; Raudenbush &- Bryk, 2002 )。 多层模型，也叫做“分层 
线性模型” （ HLMs; Bryk &- Raudenbush， 1992 ； Raudenbush 
& Bryk, 2002)、“ 混合模型”、“方差分子模型”或者“随机系 
数模型”。这一模型的一个重要的能力是在分析嵌套数据时 
(例如，当学生被嵌套在学校之中时)允许多级方差的区分。 
对 MLM 模型的一 些介绍 可以在 Hofmann(1997) , Kreft 与 
de Leeuw(1998) 以及 Luck(2004) 的著作中找到。 MLM 和 
LGM 分别起源于不同的统计研究和理论，它们各自有专门 
的术语和研究问题的标准体系。但是，现在越来越明显的 
是，这两种模型在很多情况下存在很多重复之处。在本章， 
我们主要讨论它们的重叠部分。 

在多级嵌套的数据中，最低的一层总是被叫做“第一 
层”，更高的层有更高的次序。在很多情况下都可以看到嵌 
套数据，例如，学生(第一层)被嵌套在学校(第二层)之中，工 
人被嵌套在产业之中，病人被嵌套在治疗小组之中。结果变 
量通常是在第一层测量的，但是他们的预测变量可以存在于 
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第一、第二甚至更高层。一般来说，每个组(第二层的单位) 
会在解释变量和结果变量上有不同的关系。解释变量在各 
组中的系统变化通常被用来解释这种组内的不同关系。例 
如，私立学校的学生可能比公立学校的学生有更好的考试成 
绩，因此研究者也许想检验不同的干预方式对消除这个组间 
区别的功效。在这个例子中， MLM 可以被用来研究不同的 
矫正阅读计划在不同的环境中可能会有的不同影响。 
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第1节 | MLM 在重复测量数据中的 
应用 


使用多层模型研究组内的嵌套和研究增长曲线之间有 
一 个很简明的概念关联 （ Diggle , Liang & Zeger , 1994； 
Longford , 1993)。 在重复测量的设计中，测量的时点（第一 
层)嵌套在个人之中（第二层），一旦测量时点被作为第一层 
的测量嵌套第二层之中，多层模型分析对纵向数据的处理就 
同其他多层模型的应用一样了。 

一般来说，研究者通常以估计一个随机效应的方差模 

型-个没有解释变量的模型——来决定多层模型是否 

比传统的最小二乘法更好。这个模型把结果变量的方差分 
成因时间而产生的差异(个人在不同重复测量时点的差异， 
即第一层)和不同个人之间的差异(个人之间的差异，即第二 
层）。如果有一大部分人之间的差异需要被解释，研究通常 
会逐步把预测变量加到公式中。这种做法允许在第一层变 
量时间上定义结果变量的变化，并且可以通过加入在个人之 
间变化的第二层的解释变量来进一步建模。 

这些解释变量或有固定系数，或有随机系数。固定系数 
是在估计上忽略与第二层变化相关的系数。例如 ，一 个研究 
者想研究随着时间变化，儿童每周零用钱(第二层)对儿童的 
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数学成绩(第一层)的影响，设定零用钱收人作为一个固定系 
数，将产生一个零用钱对儿童学习成绩的总体平均影响。但 
是,设定零用钱的斜率系数为随机系数，将会额外地产生一 
个零用钱对儿童数学成绩影响上的差异的估计，这个估计又 
可以用别的变量来建模。在 MLM 的几个优点中，随机系数 
估计的方差可以通过更高层次的解释变量来预测，这是一个 
很大的优势。一般来说，在 MLM 中，这些解释变量先被作 
为固定系数包括进去，如果模型的拟合度能被大大提高，就 
可以使系数随机变化。 

使用多层模型检验多重测量数据的一个明显的优势是， 
假定缺失数据是随机的，即使在一些场合下有部分缺失数据 
的个人，它仍能够使用所有可获得的数据。此外，用 MLM 
模型不需要假定每一个研究对象都在统一时点或者年龄上 
测量，甚至测量的次数也可以是不一样的。鉴于这些优势， 
如果研究者在多重测量数据研究中想要得到一个可靠的结 
果， MLM 似乎是一个很好的选择。 
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第2节I模型设置 


一般来说，用来分析线性变化的 MLM 模型的结果变量 
: V 会作为时间的线性函数 [22] : 

yn = §>j + +eij [4.1] 

Eij ~ N{0, trf} [4. 2] 

在此，馬是个体）的截距，色是个体）的斜率％是个体 J 在 
时点 z 的残余项(服从均值为0、方差为 g 的正态分布）。截 
距和斜率一般都被看成随机变量，关于个体之间的方差建模 
如下： 


A = y 。。十 Mo) [4.3] 

§ij = 7w + Ml； [4- 4] 

roo n] 

L [4.5] 

rii 」 J 

在设定这两个参数为随机数据时，截距 (@) 和斜率(私） 
项被设定为一个包含固定效应的函数，即样本中所有人特征 
的平均效应加上每个人在固定效应基础上的偏离。在方程 
4.3 和方程 4. 4中，《代表这些偏离 (叫 为偏离平均截距的部 
分，％是偏离平均斜率的部分)。这些偏离项的方差和协方 
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差 ( r m 、 rn 和 n 。) 通常是有理论旨趣的部分，例如，研究者可 
能想研究那些起初数学能力比较高的儿童的成绩是不是比 
那些起初比较差的儿童的成绩提高得更快。截距与斜率之 
间正的协方差显示那些起初成绩好的儿童随着时间的推移， 
其提高也更快。把方程 4. 1、方程 4. 3、方程 4. 4结合，会产生 
一个扩展 方程： 

: yj ； = y 。。 + yio (time i3 ) + Mo ; + u lt ( time ,,) +£；, [4. 6] 

方程 4. 6 显示了一个多层的回归方程可表示为固定戒 

分- 7 oo + 7 iq {timeij ) 和随机成分- ^ ^ ) 的 

总和。这个模型估计了两个固定效应(7。。和 X 。）和四个随机 
效应——个人在固定的截距和斜率的偏离的方差和协方差 
( r 。。、 r „ 和 r w ) 以及模型中任何剩下的、不能解释的方差 
(¥)。基于对这些截距和斜率的方差和协方差的估计，研究 
者可以对研究问题进行合适的推论。 

与传统的回归类似， MLM 模型一方面能够分别估计个 
人层次的影响和同一个人在不同测量上的影响，另一方面， 
它还能够研究变化之间的关系，因而作用更强大。当将多层 
模型应用到多元变化中时，或当我们对起始的水平(截距)和 
变化速度(斜率）间的关系感兴趣时，后一个特点尤其有用。 
当然，基于这个标准的随机截距、随机系数的模型针对特别 
例子的许多扩展也是可能的。例如，研究时变变量和非时变 
变量是可能的，也可以添加和检验一些模型参数的限定，并 
估计多元模型。 
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第3节 I 参数估计 


ML 和 FIML 估计通常被用来在多层模型中获得参数估 
计。正如在结构方程模型中一样， ML 估计在多元正态分布 
的假设前提下会产生一套参数估计，以使可观测到的数据成 
为最可能的结果。不同的统计软件在获取最大似然估计时 
会采取不同的 方法。 例如， MLwiN(Rasbash et al . ， I 999 ) 用 
一个广义迭代最小二乘法获取所有参数的最大似然估计值。 
另外，当最大似然估计被应用到最小二乘化的残差中时，这 
种方法被称为“有限制的最大似然估计” （ REML )。 在 
MLwiN 中获得 REML 解的算法是有限制的广义迭代最小二 
乘法。较之 MLwiN ， HLM ( Bryk , Raudenbush &- Congdon , 
1996) 使用将期望值最大化的算法提供一个经验性的贝叶斯 
估计，当其满足正态分布假定时，它相当于广义最小二乘法 
的估计。 FIML 在似然估计中既包括固定参数，也包括随机 
参数; 而 REML 则是估计模型中消除固定效应后的方差成分 
( Hox , 2000, 2002)。 Hox 进一步指岀，因为这一点，当方差 
差异检验涉及不限制固定参数的情况时，最大似然估计不应 
当被用来进行方差差异检验(也可参考 Singer &- Willett , 
2003:90、 118)。 
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第4节 | 模型评估 


同最小二乘回归一样，多层模型的假设通常会通过利用 
固定统计上或实际中回归系数的显著性来评价，虽然随机系 
数的方差和协方差经常是我们感兴趣之处。参数显著性的 
一个非正式检验是将其点估计值除以它的标准误，如果这个 
比率超过 2. 00( 在无限大的样本中是 1. 96)，估计所得参数 
就可称为“在 0.05 显著水平上与0显著不同”。关于多层模 
型的显著性检验的更详尽的讨论，请参见 Hox (1998) 的有关 
论述。 

多层模型的总体拟合度的信息也是可获得的，它会被作 
为一个“偏离统计量”报告出来，定义为一 2 ln L 。 在这里 ， L 
是似然函数在收敛处的似然值 （ Hox ， 2002； Kreft &- de 
Leeuw , 1998； Li , Duncan , Harmer , Acock &• Stoolmiller , 
1998) 。偏离统计量并不能为模型总体的拟合度提供一个容 
易解释的度量，因为这个指标和样本数目的大小密切相关。 
然而另一方面，在嵌套的模型中，偏离统计量之间的差异服 
从卡方分布，自由度等于嵌套模型之间参数数量的差异 
( Goldstein , 1995； Hox , 2000，2002； Li et al . , 1998)。 
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第5节 | MLM 和 LGM 重合的方面 


MLM 和 LGM 可以用于涉及重复测量数据的很多相同 
的情况。事实上，两者因为在方程式的层次上具有相似的模 
型表达，所以在很多情形下会产生同样的结果。因此，认为 
MLM 和 LGM 相似也不是什么新的提议。这两种方法重叠 
的各个方面在各种文献中已经被多次说明了。在两个框架 
中，相应的重复测量模型可以被设定来获得同样的参数估计 
(在可容忍的误差内 ）（ Bauer , 2003； Bauer & Curran , 2002； 
Chou , Bentler &• Pentz , 1998； Curran , 2003； Hox , 2000, 
2002； Khoo &- Muthen , 2000; Li et al . ， 1998; MacCallum &• 
Kim , 2000; MacCallum et al . , 1997; Raudenbush , 2001； 
Rovine &• Molenaar , 2000； Stoel , 2003； Wendorf , 2002 ； Wille ¬ 
tt &- Sayer , 1994)。 例如，在已经描述过的基本的线性增长模 
型中，多层模型中所有我们感兴趣的六个参数在潜变量增长 
模型里都可以找到相应的参数。具体说来，平均截距估计在 
两个模型中分别由/。。和山表示(见表 4. 1)。同样，随时间变 
化而产生的均值变化，即斜率参数，在这两个模型中分别由 
X 。和 a 2 表示。截距和斜率的方差、协方差以及方差的分布 
也都能在两种方法中得到表达。虽然在结构方程模型和多 
层模型中的估计方法是不一样的，但它们都会使用所有可以 
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利用的信息产生参数的最大似然估计值(包括它们的标准 
误)。因此，对于在两种框架中都有相同代表的模型，我们可 
以合理地期待多层分析中的参数估计值和潜变量增长模型 
中的参数估计值是一样的。 [23] 表 4. 1包含一个实例，用母 
亲一子女亲密度数据和模型4来说明这一问题。其中多层分 
析是使用 MLwiLl . 1完成的，参数估计值和标准误与表 2. 6所 
显示的一样。 


表 4.1 与模型4对应的多层模型的参数估计 


多层模型 

潜变量增长模型 

解 释 

估 计 

/\ 

7 00 

八 

a\ 

平均截距 

38. 00(0.08) 

7 io 

/\ 

at 

平均斜率 

-0. 36(0.02) 

A 

TOO 

*p\\ 

截距方差 

2. 98(0.29) 

A 

rn 

/\ 

022 

斜率方差 

0. 14(0, 02) 

八 

rio 

八 

中 21 

截距一斜率协方差 

0. 25(0. 06) 

心 2 

d E 

扰动项方差 

3. 70(0. 10) 


MLM 和 LGM 的另一个有趣的相似性也值得注意。在 
MLM 的传统中，通常会得到随机系数的经验贝叶斯估计值， 
即基于每一个第二层单位的模型得到的截距和斜率的估计 
值，这通常是为了绘图和诊断的目的。这些参数也被称为 
“后验均值”(因为它们是给定数据的随机系数的后验分布的 
均值估计)或“收缩估计值”（因为它们会与第二层单位的可 
靠性成比例地朝着截距和斜率的均值的方向收缩)。在潜变 
量的传统中，经验贝叶斯估计值相当于因子分数，即潜变量 
的后验估计值。在 LGM 中，这些估计值是模型暗含的截距 
与斜率的值，根据每个个体(或第二层单位)贡献的可靠性加 
权得到。我们认为，在 LGM 中计算因子分数是没有实际价 
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值的，主要是因为它们是有偏估计值，不能准确反映个体的 
轨迹。而且， Bartholomew (2007) 指出，研究者不可能确定地 
将因子分数分配给个体，因为对于每个个体，模型都暗含了 
一个这一分数的分布，而因子分数则表示这些分布的均值。 
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第6节 | MLM 和 LGM 的不同之处 


对于这里考虑的纵向数据， LGM 和 MLM 在数学上是 
等同的。两种方法中一些可以觉察到的差别是由计算它们 
的统计软件 (Raudenbush &• Bryk , 2002) 和历史传统上的差 
别造成的。虽然每种方法比起另外一种的确都有一些灵活 
性方面的局限性，但是以前的一些局限性已经随着软件水平 
的提高而消失。上一节的目的是说明两种模型应用于分析 
纵向数据时重合的地方，但在有些情况下，一些应用可能在 
一个框架下可行，在另外一个框架下就不可行。这些方法上 
不能重叠的部分是由目前一些操作软件的执行局限性所致 
的。例如，比起 MLM ， LGM 的一个显然的优势在于 ， LGM 
有能力设定一个测量模型，也就是说,重复测量不需要像在 
MLM 模型中那样必须避免测量误差。在 LGM 中，每一个 
重复测量的变量可以被设定成一个有很多指标的潜变量 
( Curran , 2000； Khoo &- Muthen , 2000)。然而，假定重复测 
量的潜变量因子结构不随时间变化的模型较之测量模型有 
更大的统计效力，但从理论上来说，测量模型也能够被纳人 
MLM 软件包中，如 Mplus 就能够估计多层次结构方程模型 
( L . K . Muthen &- Muthen , 1998—2006)。 

MLM 模型的第二个局限性是它不能够在设定上让模型 
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参数去预测别的变量。而 LGM 不仅仅把这些参数变化作为 
参数，更可将其作为变量，所以 LGM 没有这些缺陷 (Bauer &• 
Curran , 2002； Hox , 2000)。目前许多不能够通过 MLM 实 
现的复杂的模型却可以在 LGM 模型中轻易实现。一个最近 
文献中的例子就是在第3章讨论过的、对随时间变化的群体 
间差异进行假设检验的应用 （ Muth 6 n &• Curran , 1997)。目 
前，纯粹的 MLM 还不能估计像 Muth 6 n 和 Curran 那样的通 
过建构一个潜变量来影响另一个潜变量建构的模型。 

MLM 模型的第三个局限在于它不具有 LGM 模型能够 
估计因子负载的能力，这个能力在未设定轨迹的增长模型 
(第2章的模型 11) 和结构潜变量曲线模型 SLC 中非常有用。 
在 MLM 框架中，时间被当做一个数值已知的变量 ( MacCal - 
lum et al . , 1997) „ 

虽然 LGM 模型有一些独特的优点，但这并不意味着 
MLM 模型没有它独到的长处。 MLM 模型较之 LGM 模型 
一个明显的长处是， MLM 模型能够处理两个以上层次的模 
型。例如，一个数据包含学生这一层的多重测度，学生又嵌 
套在班级之中。这样的模型在 MLM 中十分简单易行，但是 
在 LGM 模型中就很难实现 （ Curran , 2003； Muthen &- 
Muthen , 1998—2006)。关于多层结构方程模型的一个较好 
的概述，参见 Hox (2000) 、 Metha 与 Neale (2005) 的著作。另 
外，虽然 SLC 模型能够近似地对时间的复杂的非线性函数建 
模，但这样的函数在 MLM 模型框架中不需要近似就可以直 
接建模。这取决于使用什么样的软件包。 

在这节中，我们已经试图列出存在于 MLM 和 LGM 中有 
关模型设定的一些差异。如果我们把讨论的内容展开一些， 
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还可以探讨很多别的问题,包括由历史根源导致的差异。例 
如对于我们已经描述过的模型，一方面存在是否使用相应的 
拟合模型的统计指标的差异，另一方面,修正模型指标常常在 
LGM 与 SEM 中被视为投机 ( MacCallum , Roznowski &■ Ne - 
cowitz , 1992), 而在 MLM 中，解放参数则被认为是可以接受 
甚至是受到鼓励的。除了注意到在这些不同传统的分支中， 
历史原因在很大程度上决定了研究者认为什么做法是可以 
接受的，我们也要注意判断何种模型的优越性在很大程度上 
依赖于软件发展的分析传统，而不一定是技术上的优越性。 

虽然 MLM 和 LGM 模型分别起源于不同的理论与实践 
传统，但这两种模型对于研究者来说都是有用的工具，它们 
都能为关于随时间变化的问题提供相似的答案。多亏最近 
的软件发展和估计技术的进步，以前被认为在一种方法或另 
一种方法中不可能实现的方面，现在也变为可能。例如，缺 
失数据估计已经使 LGM 这种方法很接近 MLM 模型的应 
用。另外， MLM 软件现在有能力对不同的误差项结构建模， 
这在以前是 LGM 的一个优势。 MLM 和 LGM 之间的差异 
正在迅速缩小，但是，这两种方法现在依然是不同的，研究者 
需要慎重地考虑使用哪种方法来进行模型检验和发展。随 
着模型设定框架和软件的发展，预计这两种模型的区别最终 
将彻底消失。 
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第7节 | 软件 


目前，大量的统计软件包都可以做 mlm 。 专用的软件 
包括 aML 、 HLM 和 MLwiN 。 几个一般的统计软件包括 R 、 
SAS 、 Splus 、 SPSS 、 Stata、SYSTAT 和 SEM 程序。 EQS 、 
LISREL 和 Mplus 现在也有能力估计多层模型。在这些软件 
中， R 、 SAS 、 Splus 和 Stata 包含能够估计非线性多层模型的 
程序。对于二分变量和定序变量作为结果变量的模型，则需 
要 REML 和 FIML 之外的方法(例如，最大边际似然估计、惩 
罚性准似然估计、经验性贝叶斯估计或者马尔科夫链一蒙特 
卡罗估计），因此对于这些类型的数据，经常需要特别的软 
件。 aML 可以在网上免费获取，此外它还能够处理几种不标 
准的数据类型和模型，如包含截断数据和删失数据的回归模 
型、多层风险模型、定序或者计数数据、曲线模型和很多其他 
模型。 MIX (—个独立的程序集，或者 SPSS 和 SAS 的宏命 
令)也能够估计很多不同数据类型的多层分析模型。如果研 
究者想要对定序变量、计数变量或者一般的非线性数据建 
模，我们建议研究这些 LGM 之外的选择。更多关于多层模 
型的软件信息可以参考 de Leeuw 与 Kreft (2001) 以及 Sni - 
jders 与 Bosker (1999) 的著作，还有上面提到的统计软件包的 
使用说明。 
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在本书中，我们对潜变量增长曲线模型做了一个 介绍: 
用数据说明各种应用，描述几种模型的拓展和更高级的模型 
在 LGM 框架中的应用。我们说明了如何在简单的线性模型 
基础上对更高级的模型进行建模、设定和评估，包括用群体 
作为预测变量、设定相关增长曲线以及包含队列次序设计。 
我们展示的各种可能的模型表明，这类技术既是灵活的，也 
是强有力的工具。 LGM 作为一个应用统计的领域，在最近 
的方法理论文献中正引起越来越多的注意，从各个方面完善 
这个方法的文献也正在迅速累积。这本书为那些正在寻求 
适应这个领域迅速发展的研究者提供了一个概念、理论和应 
用上的基础。 

LGM 框架的一个最令人注目的特点是它具有把现存的 
模型用一些新的方法进行扩展的潜力。我们尤其肯定的是， 
结构潜变量曲线方法在应用实践中有很大的潜力。在实践 
中应用复杂的曲线模型的唯一障碍是缺乏容易获得和使用 
的软件，这个问题一定会在将来得以解决。现在，大量的相 
关领域的研究也在迅速发展，包括交互潜变量的增长曲线模 
型 ( Lietal . ，2000)、绘图和探索条件增长曲线的简单效应 
(Curran et al . , 2004； Preacher et al . , 2006) 以及对增长混 
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合模型的进一步发展和完善 （Bauer Curran , 2003 a , 
2003 b , 2004)。 除此之外，很多最近的研究也在探究对缺失 
数据的处理以及对分类数据的研究。在一些其他领域，研究 
者也有机会对 LGM 进行拓展。例如，虽然 e 中的干扰项通 
常被设定成相互独立的，但是这种限制也可以是不必要的 
( Browne , 1993; McArdle , 1988)。允许干扰项服从一个一 
阶的自相关结构是很平常的，通常相邻干扰项的协方差被设 
置成自由参数 （ Browne ， 1993; Meredith &- Tisak ， 1990; 
Willett & Sayer , 1994)。 另外，设定一个基于误差协变量的 
因果结构也是可能的。 

虽然我们关注的问题是在频率统计框架中的 LGM 模 
型，但计算机技术的提高已经使得贝叶斯方法比过去更有 
用。贝叶斯方法在 LGM 的应用包含对定序变量和二分变量 
的建模、非线性增长模型的建模、多样本和混合模型建模等， 
还有对于可忽略的或不可忽略的缺失数据进行拟合、对非正 
态数据的拟合以及以上这些在标准结构方程模型中往往会 
引发问题的模型的组合。贝叶斯统计的一个重要标志，即把 
先验的信息包括在模型中，是可能的。简言之，贝叶斯统计 
方法在 LGM 中的应用是灵活强大并具有潜力的，但是它往 
往会要求使用者具备更高的统计知识。关于这一新兴方法 
的更多信息，有兴趣的读者可以参考 Lee (2007), Scheines , 
Hoijtink 与 Boomsma (1999) 以及 Zhang 、 Hamagami 、 Wang 、 
Nesselroade 与 Grimm (2007) 的著作。 

虽然这本书关注的是潜变量增长曲线模型，但是这种模 
型不是唯一的探索纵向数据的潜变量方法。和 LGM 相关的 
技术包括探索性纵向因子分析 （Tisak Meredith , 1989, 
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1990) 和使用纵向结构方程模型探索随时间变化的测量信 
度、效度与稳定性等 (Tisak Tisak , 1996, 2000)。自回归 
模型和自回归交叉滞后模型在很多情况下是对增长曲线模 
型的可行替代(参见 Bollen &- Curran , 2004; Curran et al ., 
1997)。 上一章讨论的多层模型在分析纵向数据中也有广泛 
的应用。 

虽然我们试图提供尽可能必要的信息以使读者对于 
LGM 模型有一个完善的基本了解，但是我们的目标还远未 
实现。我们的目标是为基本的 LGM 方法提供一个概述，展 
示它的应用，并描述方法上的一些最新进展。在这些主要的 
问题之外，一个更广泛的建议是，通过规划明确地包含时间 
的模型可以获得许多关于数据本质的真知灼见 （ Collins , 
2006)。正如 Anderson (1993:929) 所说： “一个真正的纵向研 
究是无可替代的。” LGM 分析代表了这种研究的一个类别， 
它能够帮助研究者形成假设，探索变化形态和相关的趋势。 

我们特意将参考书目列得很长，因为这本书的另一个目 
的是为有兴趣的研究者提供一个人门参考。关于在这本书 
中讨论的特定问题的更多信息，我们推荐读者去阅读相关的 
引用文献。对于 LGM 模型的介绍，请参考 Bryne 和 Crombie 
(2003 )、 Chan (1998 )、 Curran ( 2000 ) 、 Curran 和 Hussong 
(2003 )、Hancock 和 Lawrence (200 6) 以及 Willett 和 Sayer 
(1994) 的著作 。 Singer 和 Willett (2003: 第 8 章)对 SEM 和 
LGM 提供了很好的介绍。关于 SEM 的更复杂和详细的论 
述，我们强烈推荐 Boll en (1989) 的 著作; 关于 LGM ， 我们推荐 
Bollen 和 Curran (2006) 的著作。 
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想更多地了解潜变量增长曲线模型的研究者还可以从 


网上获得资源，下面我们就简要地列出这些资源。 
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附录 1 I 绘图和探索潜变量増长曲线 
模型中的交互项 


在普通线性回归中，交互(调节)效应通常是通过描绘交 
互图来实现。为了便于理解，交互图展现出在调节变量 M 的 
特定值下 y 对 X 的回归结果。 LCA 框架的一个主要优势在 
于，表示截距和斜率的因子可以是其他模型中的内生(因)变 
量,如模型6那样。当这些变化可以通过外在变量 M 来预测 
时，重复测定变量 Y 受到时间的影响就随着 M 而变化，这一 
点非常类似普通回归中 Y 对 X 的回归受到 M 的影响。反 
之，我们同样可以说， y 受到 M 的影响随着时间而变化。这 
种效应被称为“交叉水平交互作用”。 

回归方法中，通常用于描述交互作用的方法 （Aiken &■ 
West , 1991) 也可以用于 LGM 框架中 （Curran et al . ， 2004; 
Preacher et al . , 2006)。 我们不仅可以画出任意 M 值下，模 
型中 Y 随着时间变化的平均轨迹，甚至还可以描绘出任意情 
况下 y 对 M 的回归图。绘制交叉水平交互的工具可以参考 
http ：// www . quantpsy . org , 其中还包括指南和完整的实例。 



132 


淆变 置 增长曲线模型 


附录2 | 描绘个体轨迹 


LGM 分析中的大部分信息都是总结性的，输出结果通 
常的形式包括平均趋势、这些均值的变化和某些不符合这些 
趋势的个案。 Carrig 、 Wirth 和 Curran (2004) 曾用 SAS 中的 
宏 ( macro , OL & mj ) 来绘制群体层面和个体层面的轨迹图。 
OLS « m ; 可以作为起始步骤辅助进一步的 LGM 分析，也可 
以作为描述数据的方法。除了提供个体轨迹图之外， OL - 
Smy 还可以提供估计参数的群体层面的直方图和箱形图， 
同时还可以输出个体参数估计值。 OLSmy 和其手册可以在 
http ：// www . unc . edu / 〜 curran / olstraj . htm 上得到 0 
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附录3 I 程序语句 


本书中所有分析的 LISREL 、 Mplus 和 Mx 语句，都可以 
在第一作者的网站 ( http :// www . quantpsy . org ) 上找到。 
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注释 


[ 1 ] http://www. quantpsy. org/ 

[2] 对于熟悉在结构方程模型中 LISREL 框架下模型设定的读者，这里的 
数学表达式使用的是“全一 y’ 模型，即所有的潜变量都被认为是内 
生的。 

[3] 矢量由下划线表示，而矩阵由黑体字表示。 

[4] 重要的是要 记住执 中的元素并不表示通常意义上的误差方差。更确 
切地说，蛛中的第〖个方差反映了一个线性模型在多大程度上没能在 r 
个时点获得个体的分数。这种变化性大多是误差造成的，但也可能是 
由于其他变量预测的影响。 

[ 5 ] 另一方面， St 00 lmill er (1995) 建议在多项式中将时间变量对均值对中， 
以避免由多项式各项的线性依赖而造成的估计问题。 

[6] 当“缺失”并不依赖于: c 或其他变量的可观测或不可观测的反应时，缺 
失数据(对于: T) 是完全随机缺失。当“缺失”在控制数据中的其他变量 
的条件下而并不依赖于 x 的可观测或不可观测的反应时，: r 的缺失数 
据是随机缺失 (Allison， 2002)。 

[7] 据我们所知, Mplus 是唯一在有数据缺失时仍然计算拟合指数的结构 
方程模型软件。 

[8] 可能是由于增长曲线模型的高度限定性，根据总体拟合标准，它们的拟 
合常常较差。但是，有时在个体增长曲线模拟得较好的情况下，模型也 
会拟合较差。 Coffman 和 Mill S ap(2006) 建议用个体拟合标准来补充总 
体拟合指数。 

[9] 这一自由度的公式假设样本数据由均值与协方差构成。增长曲线模型 
几乎总是拟合到均值与协方差。如果没有对均值结构建模，那么自由 
度为 [_ p { p ^ rl )/ 2 ]-q 0 

[10] 我们为了教学的简明易懂而使用完全数据。而且，使用完全数据可以 
获得完整的结构方程模型拟合指数。 http：//www. quantpsy. org/ 提供 
了接下来使用的分析数据以及计算机语句。 

[11] LISREL 可以从科学软件国际的网站上 （ http://www. ssicentral. 
com/) 获得; Mx 可以从弗吉尼亚联邦大学的网站上 （hnp://ww. 
vcu. edu/mx/) 获得； Mplus 可以从 L. K. Muthdn 与 Muthen 的网站上 
(http ： //www. statmodel. com/) 获得。 

[12] 在整本书中，我们为了教学的简明易懂而把扰动项方差限定为相同。 
而且，设定母亲一子女亲密度的残差变异性一直随时间保持稳定是合 
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理的。如果有足够的重复测量来识别这些参数，是不需要这一相同的 
限定的。实际上， LGM 方法的一个强项就是我们可以通过估计不同时 
点的残差方差来明确地对异方差性或其他各种各样的扰动项协方差结 
构进行建模 (Willett &■ Sayer , 1994)。但是，在其他条件相同的情况 
下，我们建议应尽可能地先对同方差性建模以获得最大化的简约性。 
而且，由于允许残差方差在不同时点不同，有时会掩盖或“吸收”轨迹中 
的非线性，产生具有欺骗性的好拟合。 

[13] 我们的网站 ( http :// www . quantpsy . org /) 提供了这 一 模型以及接下来 
的大多数模型的程序语句。 

[14] 这就是我们前面提到的嵌套模型检验。在这一检验中，两个模型的卡 
方值的差异本身被当做一个卡方统计值，它的自由度等于两个嵌套模 
型的自由度的差异。 

[15] 需要说明的是，在这一过程中并没有真正估计单独的截距与斜率，相 
反，这一模型将一个多元正态分布加于潜变量并得出这些分布的均值、 
方差和协方差的估计值。 

[16] 孔径或许可以在某些结构方程模型软件中通过把 vfe 限定为0,并把斜 
率因子限定为它们的原始固定值减去一个孔径参数而作为模型参数的 
直接估计。 

[17] 在这个模型以及后面的模型9中，我们会使用 (9 参数，它们是第1章中 
没有讨论的完全结构方程模型的路径系数矩阵 ( B ) 的元素 （ Bollen ， 
1989)。 

[18] 因为这一相似性，多层模型中的跨层交互可以按照 Aiken 和 West 
(1991) 的指导被分解、检验和绘图。更多的讨论参见 Curran 、 Bauer 和 
Willoughby (2004) 以及 Preacher , Curran 和 Bauer (200 6 ) 的著作。 

[19] 这两种检验队列效应的方法同模型5和模型6中所讨论的两种检验变 
化的外生自变量的效应是可直接比拟的。 

[20] 以似然值为基础的置信区间是由确定为了使模型拟合度下降某个给定 
的数量时，一个参数必须取的值来计算的。例如，95%的置信区间是由 
把参数值一点一点移离最大似然估计值(每一次都重新对模型进行最 
优化），直到最大似然估计函数增加 84 个卡方单位( 3 . 8 4 是自由度 
为1时卡方的临界 值)。 由于需要大量的中央处理器密集地重新最优 
化，这一设定置信区间的方法会非常费时，但是以似然值为基础的置信 
区间较之标准误有好几个优势，后者以正态分布(对方差参数往往不正 
确)为前提，需要随重新参数化而变化的《检验，并且有时会对边界参 
数得出荒谬的结果。虽然标准误在报告参数估计值时仍然是必要的， 
但我们预测因为它们可取的特性，以似然值为基础的置信区间将变得 
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更受欢迎，特别是随着计算机价格的下降和计算效率的提高。 

[21] 为了能识别这一模型，两个负荷必须被限定。任意两个负荷都可以，只 
要它们被限定为不同的值。 

[22] 我们的标记方法与 Kreft 和 de Leemv(1998) 的相似，用下划线表示随 
机系数。在之前讨论的潜变量增长曲线的矩阵中，下划线表示矢量。 

[23] Ho X (2000) 为这一紧密的相似性提供了一个钲明，他发现在数据完全 
随机缺失或随机缺失的情况下，对于所有的方法，前者的参数估计值更 
为接近。 
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Standardized Root Mean Square Residual 

(SRMR) 

标准化残差均方根 

Structural Equation Model (SEM) 

结构方程模型 

structured latent curve models 

结构潜变量曲线模型 

threat of contamination 

污染威胁 

time-invariant covariates 

非时变协变量 

Time-Varying €ovariates( TVCs) 

时变协变量 

truncated data 

截断数据 
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